<aside>
1️⃣ 프로젝트 개요
- 프로젝트 이름:(예: 고객 이탈 예측 분석)
- 분석 목적:(예: 고객 이탈을 사전에 예측하여 효율적인 마케팅 전략을 수립하기 위함)
- 데이터 출처:(예: Kaggle 데이터셋, API 및 크롤링 데이터)
- 분석 대상 및 범위:(예: 2020~2024년 사이의 고객 데이터를 대상으로 분석)
- 예상 결과물
- (시각화 자료: 주요 변수와 고객 이탈의 상관관계를 보여주는 Heatmap 및 Bar chart)
- (인사이트 요약: 월 평균 요금과 이탈 가능성 간의 상관 관계, 이탈 가능성이 높은 타겟의 특징 도출)
- (타겟 유저 별 메세지/소재 아이디어 도출 → 메세지/소재 설계안 초안 작성)
- (보고서 및 발표 자료: 분석 결과를 요약한 프레젠테이션 자료와 PDF 보고서)
</aside>
작성
<aside>
2️⃣
데이터 개요
- 데이터셋 설명
-
데이터 수집 방법: (예: API를 통해 수집, 다운로드, 내부 시스템에서 추출)
-
데이터셋의 크기: (예: 10,000행, 20열)
-
주요 변수 및 설명: (예: 표 참고)
| 변수명 |
설명 |
데이터 타입 |
| customer_id |
고객 ID |
정수 |
| churn |
이탈 여부 |
범주형(Yes/No) |
| monthly_charge |
월평균 요금 |
실수 |
- 데이터 전처리 과정
- 결측치 처리 방법:(예: 평균값 대체, 특정 행 제거)
- 이상치 탐지 및 조치:(예: IQR 방식으로 이상치 제거)
- 데이터 변환(필요 시):(예: 로그 변환, 범주형 변수 인코딩)
</aside>
작성
<aside>
3️⃣
탐색적 데이터 분석(EDA)
- 기술 통계 분석
- 주요 변수의 분포*(예: 월평균 요금의 평균: 50, 표준편차: 10)*
- 평균, 중앙값, 표준편차 등 기초 통계량
- 데이터 시각화
- (예: 상관관계 분석: Heatmap을 통해 주요 변수 간 상관관계 파악)
- (예: 변수 간 관계: Scatter plot, Box plot 활용)
- (예: 범주형 변수의 빈도 분석: Bar chart로 이탈 여부 시각화)
- 패턴 및 트렌드
- (예: 시간/날짜와 관련된 변수의 추세 분석)
- (예: 특정 변수 간 상관관계 발견)
- 주요 인사이트 도출
- (예: 월평균 요금이 높은 고객일수록 이탈 확률이 낮음)
</aside>
작성
<aside>
4️⃣
현재까지의 진행 상황
- 진행한 작업
- (예: 데이터 전처리: 결측치 제거, 이상치 처리 완료)
- (예: 주요 변수의 기술 통계 및 시각화 완료)
- (예: 타켓 별 주요 메세지 발굴)
- 해결된 문제
- (예: 결측치가 많은 변수를 다루기 위한 전략 수립 및 적용)
- 진행 중 문제
- (예: 데이터 부족으로 인한 추가 수집 필요)
- (예: 특정 변수의 패턴 해석 어려움)
</aside>
작성
<aside>
5️⃣
다음 단계 계획
- 추가로 분석할 내용
- (예: 기획안 마무리 및 소재 제작)
- (예: 소재 기반 광고 집행)
- (예: 외부 데이터 결합 가능성 검토)
- 예상 일정
- (예: 1월 21일까지 심층 분석 완료)
- (예: 최종 보고서 작성: 2월 5일 완료 예정)
</aside>
작성
<aside>
6️⃣
부록
- 사용된 툴 및 라이브러리
- 참고 자료 및 출처
- 기타 시각화 자료
</aside>
작성
<aside>
<img src="/icons/first-aid_red.svg" alt="/icons/first-aid_red.svg" width="40px" />
</aside>