-
총평:
- 전반적으로 체계적인 데이터 분석 과정을 거쳐 문제 정의부터 해결 방안 제안, 그리고 검증 계획까지 비즈니스 프로젝트의 흐름을 잘 보여준 발표
- 특히 데이터 전처리 및 분석의 깊이와 다양한 가설 검증을 통해 유의미한 인사이트를 도출하려 노력한 점이 인상 깊음
-
잘한 점:
- '비인기 숙소의 수익 증대 및 만족도 개선'이라는 비즈니스 문제를 명확하게 정의함. 특히, 에어비앤비의 현 상태에 대한 문제점을 '숙박 예약을 했음에도 뉴욕 숙소의 성과가 미흡함'과 '숙소의 인기도가 지역별/호스트별/숙박일수에 따라 크게 상이함'으로 구체화하여 제시한 점이 좋음
- 결측치/이상치 처리 과정을 상세히 설명하고, '인기 점수'와 같은 핵심 파생 변수를 가중치를 부여하여 생성한 점은 분석의 깊이와 목적 적합성을 높임
- 머신러닝 기반 변수 중요도 분석(인기/비인기 정확도 분석, feature importance, permutation importance)을 통해 어떤 요인이 숙소의 인기도에 영향을 미치는지 심층적으로 분석함
- '인기 숙소의 특징'과 '숙소명에 관광지 키워드 포함'과 같은 발견은 실제 비즈니스에 적용 가능한 새로운 관점을 제시함
- 여러 가설을 확인하고 관련있는 것을 묶어 의미하는 바가 무엇인지 명확하게 전달하여 내용 이해가 쉬웠음
- 주어진 데이터를 전부 분석에 사용하는 것이 아니라 설정한 목표에 맞는 데이터를 선별적으로 활용하여 보다 질 좋은 데이터로 유의미한 인사이트를 도출한 점이 눈에 띔.
-
아쉬운 점/더 시도해볼 수 있는 점:
- 비인기 숙소가 전체 숙소에서 차지하는 비중, 그리고 비인기 숙소의 수익성 개선이 에어비앤비 전체 수익에 미치는 정량적인 예상 효과(예: 비인기 숙소의 수익이 10% 증가했을 때 전체 수익 몇 % 증가)를 제시했다면 중요성이 더욱 부각되었을 것
- 비인기 숙소가 될 가능성이 높은 숙소를 예측하여 해당 숙소를 대상으로 한 마케팅을 진행하면 적은 비용으로 높은 효율 및 효과를 내는 전략도 고려해볼 수 있음
- 특정 이상치(예: 3백만 초과 가격)를 단순히 제거하는 것 외에, 해당 이상치가 발생한 원인에 대한 탐색적 분석을 추가적으로 시도해볼 수 있음. 예를 들어, 매우 높은 가격의 숙소가 특별한 특징(고급 숙소, 특별한 이벤트 장소 등)을 가지고 있는지 확인하고, 필요하다면 해당 데이터에 대한 별도의 분석 전략을 수립하는 것을 고려해볼 수 있음
- 각 인사이트가 도출된 과정에서 '왜 이런 결과가 나왔는지'에 대한 심층적인 해석이 부족한 경우가 있음. 예를 들어, '도심 숙소가 외곽보다 수익이 높다'는 결과는 단순히 보여주는 것을 넘어, 도심의 어떤 특성이 이러한 수익 차이를 발생시키는지(예: 접근성, 주변 인프라, 비즈니스 수요 등)에 대한 추가적인 추론이 있다면 인사이트의 깊이를 더할 수 있음
추가적으로 궁금하신 사항이 있다면 튜터님께 방문 부탁드립니다 💌