<aside> 📌 Task : 메인 가설
</aside>
리뷰 수, 최근 리뷰 존재, 매출 추정치가 포함→ 인기 점수
"도심 지역에서 'Entire home/apt'(아파트형) 숙소는 다른 방 타입에 비해 인기가 많을 것이다.
→ 가설 설정 이유 : 도심지역에 'Entire home/apt'(아파트형) 숙소가 가장 많이 있기 때문이다.
# 방타입별 숙소 수 계산
pivot = df_filtered.pivot_table(index='city_and_suburb',
columns='room_type',
aggfunc='size',
fill_value=0).reset_index()
# 전체 숙소 수도 함께 계산
pivot['숙소 수'] = pivot[['Entire home/apt', 'Private room', 'Shared room']].sum(axis=1)
# 각 방타입 비율 계산
pivot['아파트형 비율 (%)'] = (pivot['Entire home/apt'] / pivot['숙소 수'] * 100).round(2)
pivot['개인실 비율 (%)'] = (pivot['Private room'] / pivot['숙소 수'] * 100).round(2)
pivot['공유실 비율 (%)'] = (pivot['Shared room'] / pivot['숙소 수'] * 100).round(2)
# 열 순서 재정렬
pivot = pivot[['city_and_suburb', '숙소 수', 'Entire home/apt', 'Private room', 'Shared room',
'아파트형 비율 (%)', '개인실 비율 (%)', '공유실 비율 (%)']]
# 컬럼명 한글로 변경
pivot.columns = ['지역구분', '숙소 수', '아파트형 수', '개인실 수', '공유실 수',
'아파트형 비율 (%)', '개인실 비율 (%)', '공유실 비율 (%)']
# 출력
pivot


<aside> 📌 Task : "도심 지역에서 'Entire home/apt'(아파트형) 숙소는 다른 방 타입에 비해 인기도 점수가 더 높을 것이다. ⇒ 증명 시작
</aside>