Chanhee's Dev Blog

마케팅 Life Time Value (LTV) 예측 프로젝트: Stage 1

진행 기간: 2021.01 ~ 2022.02

프로젝트 소개

효율적인 마케팅 예산 집행을 위해 캠페인 별 평생 가치(LTV)를 예측하는 프로젝트. 자세한 문제 상황은 LTV 전체 설명 문서에 적혀 있습니다.

Stage 1 목적

Stage 1에서의 주요 목적은 기존 코드 및 대시보드의 유지보수입니다.

LTV 예측 프로젝트는 제가 입사한 2021년 이전부터 오랫동안 연구가 이어진 오래된 프로젝트로, 이미 LTV 예측값을 통해 마케터가 캠페인의 성과를 판단하는 프로세스가 어느 정도 정립된 상황이었습니다. 그렇기 때문에 주 목표는 예측 모델이 잘 작동할 수 있도록 데이터 파이프라인 및 모델 코드를 관리하는 것이었습니다.

서비스 형태

마케터는 두 가지 방식으로 LTV 예측값을 제공받았는데, 하나는 대시보드, 하나는 jupyter notebook 형태의 코드였습니다.

1. 대시보드

국가 단위의 큰 코호트 별 LTV를 주기적으로 확인하는 용도.

2. jupyter notebook 코드

캠페인 집행을 지속할지 판단하기 위한 용도.

배포 방식

1. 데이터 인프라 설명

데이터 파이프라인은 데이터 엔지니어 팀에서 관리하는 airflow 인스턴스에서 배치 잡 형태로 주기적으로 실행됩니다. 배치 잡은 AWS S3와 Glue에 저장된 DW 데이터를 읽어와 LTV 예측에 필요한 형태로 가공한 뒤, 다시 S3/Glue에 적재합니다.

2. 코드 배포

운영 및 유지보수 업무

모델링 (BTYD 모델 + MCMC 시뮬레이션)

자세한 모델링 설명은 LTV MCMC 모델 설명 문서에 작성했습니다.

회고

이 시기 동안 모델링 자체는 개선한 부분이 없었지만, 아직 python 및 소프트웨어 엔지니어링에 대해 배워나가는 시기였기 때문에 핸즈온으로 여러 작업들을 하면서 새로 배운 것들이 많았습니다.