<원본 df[’name’] 예시>

image.png

<aside> 🔑

설명…

</aside>

<aside>

의도 : 여행객들이 자주 반응하는 키워드가 있는지, 있다면 그 키워드를 활용해서 예약일수 증가에 기여할 수 있는지! 이 부분을 실험해보고 싶어서 진행하게 되었습니다

가설 설정

귀무가설(H0): 형용사 키워드를 사용한 숙소와 사용하지 않은 숙소 간 예약일수 평균에 차이가 없다.

대립가설(H0): 형용사 키워드를 사용한 숙소는 사용하지 않은 숙소보다 예약일수가 더 길다.

<프로세스>

방법 1 : 형용사 키워드 분리/키워드 유무에 따른 t-test(예약일수 평균)

방법 2: - 실제 호스트 기반 군집화 진행(’name’ 컬럼 활용)

        - 키워드 & 예약률 유효성 검증(회귀 계수, 평균 예약 일수, 분류 모델 활용)

방법1

이를 바탕으로 특정 키워드에 따라 점유율에 차이를 보임을 알 수 있고, t-검정을 통과한 키워드를 바탕으로 전략 제시

방법2

결론

<통계적 결론>

****: 키워드만으로 상/하위 예약률을 분류하고 많은 영향력을 끼친다고 할 수는 없음. 하지만, 하나의 피처가 절대적인 영향력을 미치는 경우는 드물다고 생각(가격 제외)

<전략적 결론>

: 군집 과 상위 예측에 공통적으로 등장하는 키워드를 조합함으로써 호스트에게 마케팅 전략을 제시해볼 수 있다.



</aside>

우수 숙박 업소 선정 및 마케팅 전략(랭킹)