<원본 df[’name’] 예시>

<aside> 🔑
설명…
</aside>
<aside>
가설 설정
귀무가설(H0): 형용사 키워드를 사용한 숙소와 사용하지 않은 숙소 간 예약일수 평균에 차이가 없다.
대립가설(H0): 형용사 키워드를 사용한 숙소는 사용하지 않은 숙소보다 예약일수가 더 길다.
<프로세스>
방법 1 : 형용사 키워드 분리/키워드 유무에 따른 t-test(예약일수 평균)
방법 2: - 실제 호스트 기반 군집화 진행(’name’ 컬럼 활용)
- 키워드 & 예약률 유효성 검증(회귀 계수, 평균 예약 일수, 분류 모델 활용)
방법1
이를 바탕으로 특정 키워드에 따라 점유율에 차이를 보임을 알 수 있고, t-검정을 통과한 키워드를 바탕으로 전략 제시
방법2
결론
<통계적 결론>
****: 키워드만으로 상/하위 예약률을 분류하고 많은 영향력을 끼친다고 할 수는 없음. 하지만, 하나의 피처가 절대적인 영향력을 미치는 경우는 드물다고 생각(가격 제외)
<전략적 결론>
: 군집 과 상위 예측에 공통적으로 등장하는 키워드를 조합함으로써 호스트에게 마케팅 전략을 제시해볼 수 있다.
</aside>