데이터 전체 살펴보기

  1. 전처리 및 병합

    1. 데이터 정보

    2. 전처리

      1. 카테고리별 아이템수

        Untitled

      2. event_name_1과 event_name_2의 차이

        Untitled

        event_name_1 컬럼은 더 많은 이벤트를 포함하며 반복횟수가 5~6회

        event_name_2 컬럼은 더 적은 이벤트를 포함하고 있으며, 반복 빈도도 낮음

        또한 event_name2 컬럼의 이벤트들은 event_name1에 포함됨

        이는 event_name_2가 보조적인 역할을 하는 컬럼일 가능성이 있으며, 주요 이벤트는 event_name_1에 포함되어 있다고 볼 수 있음

    3. 데이터 병합

      Untitled

    Untitled

    1. calender

      Untitled

    2. sell_prices

      Untitled

  2. EDA


CA_3과 CA_4 상점의 비교

전체 상점의 판매량을 확인한 후 판매량이 가장 높은 CA_3 상점과 가장 낮은 CA_4를 비교하고자 함

  1. 전처리

    1. 주어진 데이터셋 세개를 CA_3, CA_4 상점 필터링하여 병합(2016년 데이터 삭제)

      Untitled

    2. 카테고리별 아이템 수 비교

      Untitled

    3. 이벤트 있는 날과 없는 날의 판매량(CA_3, CA_4 매장 합쳐서) → 그냥 해본거니 무시해도 됩니다

      밑에 평균이라고 써져있는데 아입니다…..

      Untitled

      Untitled

  2. EDA