<aside> 📌 Task : 메인 가설

</aside>

리뷰 수, 최근 리뷰 존재, 매출 추정치가 포함→ 인기 점수

✅ 메인 가설

"도심 지역에서 'Entire home/apt'(아파트형) 숙소는 다른 방 타입에 비해 인기가 많을 것이다.

→ 가설 설정 이유 : 도심지역에 'Entire home/apt'(아파트형) 숙소가 가장 많이 있기 때문이다.


# 방타입별 숙소 수 계산
pivot = df_filtered.pivot_table(index='city_and_suburb', 
                                 columns='room_type', 
                                 aggfunc='size', 
                                 fill_value=0).reset_index()

# 전체 숙소 수도 함께 계산
pivot['숙소 수'] = pivot[['Entire home/apt', 'Private room', 'Shared room']].sum(axis=1)

# 각 방타입 비율 계산
pivot['아파트형 비율 (%)'] = (pivot['Entire home/apt'] / pivot['숙소 수'] * 100).round(2)
pivot['개인실 비율 (%)'] = (pivot['Private room'] / pivot['숙소 수'] * 100).round(2)
pivot['공유실 비율 (%)'] = (pivot['Shared room'] / pivot['숙소 수'] * 100).round(2)

# 열 순서 재정렬
pivot = pivot[['city_and_suburb', '숙소 수', 'Entire home/apt', 'Private room', 'Shared room', 
               '아파트형 비율 (%)', '개인실 비율 (%)', '공유실 비율 (%)']]

# 컬럼명 한글로 변경
pivot.columns = ['지역구분', '숙소 수', '아파트형 수', '개인실 수', '공유실 수',
                 '아파트형 비율 (%)', '개인실 비율 (%)', '공유실 비율 (%)']

# 출력
pivot

image.png

download.png

🔍 주요 인사이트

<aside> 📌 Task : "도심 지역에서 'Entire home/apt'(아파트형) 숙소는 다른 방 타입에 비해 인기도 점수가 더 높을 것이다. ⇒ 증명 시작

</aside>

  1. 도심 내 room_type별 숙소 수 다시 확인.