Chanhee Lee

마케팅 Life Time Value (LTV) 예측 프로젝트

진행 기간: 2021.01 ~ 2024.03

프로젝트 소개

효율적인 마케팅 예산 집행을 위해 캠페인 별 평생 가치(LTV)를 예측하는 프로젝트.

문제 상황

프로젝트 목표

프로젝트 변천사

LTV 프로젝트는 제가 이어받기 전인 2017년부터 연구가 시작돼서 장장 7년이 넘게 지속된 프로젝트인만큼, 프로젝트 나름의 역사를 가지고 있습니다. 제가 프로젝트에 참여하기 시작한 2021년부터, 프로젝트가 마무리 된 2024년까지의 변천사를 큼직한 변화를 기준으로 ‘스테이지’로 구분해 설명해보겠습니다.

stage 기간 한 줄 요약 모델링 서빙 방식 데이터/훈련/서빙 파이프라인
1 2021 기존 서비스 유지보수 Bayesian (MCMC) dashboard / jupyter notebook 서빙: airflow
2 2022 모델 성능 개선 MCMC + linear regression dashboard / jupyter notebook 서빙: airflow
3 2023 상반기 UX + 속도 개선 위와 동일 AWS Sagemaker + Dash web 데이터: AWS lambda, 서빙: AWS Sagemaker + lambda
4 2023 하반기 모델링 방법론 변경 Deep learning (MLP, TiDE) dashboard 데이터: databricks, 훈련: mlflow, 서빙: databricks
5 2024 초기 수준의 MLOps 구축 classical ML mlflow model registry 데이터: databricks, 훈련: mlflow, 서빙: mlflow

stage 1

LTV 예측 프로젝트는 제가 입사한 2021년 이전부터 오랫동안 연구가 이어진 오래된 프로젝트로, 이미 LTV 예측값을 통해 마케터가 캠페인의 성과를 판단하는 프로세스가 어느 정도 정립된 상황이었습니다. 마케터는 두 가지 방식으로 LTV 예측값을 제공받았는데, 하나는 대시보드, 하나는 jupyter notebook 형태의 코드였습니다.

  1. 대시보드: 고정적으로 보는 분석
    • 주기적으로 큰 단위의 LTV 를 확인하고자 하는 케이스
    • 대시보드에 들어가는 파라미터 종류도 적고 파라미터 값의 cardinality 도 낮음
    • 대시보드에 필요한 데이터는 매일 airflow 배치 잡을 통해 LTV DW (Data Warehouse) 에 적재
  2. jupyter notebook: 대시보드보다 좀더 세세한 분석
    • 미세하게 파라미터 값을 조정해가며 캠페인 성과를 확인하고자 하는 케이스
    • 파라미터를 interactive 하게 조정하면서 모델링 코드를 실행할 수 있는 노트북을 제공
    • 마케터가 직접 노트북을 실행한 뒤 결과를 표나 그래프로 확인할 수 있고, 엑셀로 export 할 수도 있음

더 자세한 내용은 여기에 정리했습니다.

stage 2

(작성 중)

stage 3

(작성 중)

stage 4

(작성 중)

stage 5

(작성 중)

모델링에 대해서