전처리 및 병합
데이터 정보
전처리
카테고리별 아이템수
event_name_1과 event_name_2의 차이
event_name_1 컬럼은 더 많은 이벤트를 포함하며 반복횟수가 5~6회
event_name_2 컬럼은 더 적은 이벤트를 포함하고 있으며, 반복 빈도도 낮음
또한 event_name2 컬럼의 이벤트들은 event_name1에 포함됨
이는 event_name_2가 보조적인 역할을 하는 컬럼일 가능성이 있으며, 주요 이벤트는 event_name_1에 포함되어 있다고 볼 수 있음
데이터 병합
calender
sell_prices
EDA
전체 상점의 판매량을 확인한 후 판매량이 가장 높은 CA_3 상점과 가장 낮은 CA_4를 비교하고자 함
전처리
주어진 데이터셋 세개를 CA_3, CA_4 상점 필터링하여 병합(2016년 데이터 삭제)
카테고리별 아이템 수 비교
이벤트 있는 날과 없는 날의 판매량(CA_3, CA_4 매장 합쳐서) → 그냥 해본거니 무시해도 됩니다
밑에 평균이라고 써져있는데 아입니다…..
EDA