HEARTCOUNT ABI의 Line Chart는 Prophet 모델을 통한 시계열 예측을 사용합니다.
1. 파란색 선 (예측 값)
- 파란색 선은 Prophet 모델이 생성한 **예측 값(yhat)**을 나타냅니다.
- Prophet 모델은 데이터를 분해하여 다음과 같은 구성 요소를 포함한 중앙값 예측을 제공합니다:
- 추세(Trend): 장기적인 데이터 변화 방향.
- 계절성(Seasonality): 주기적으로 반복되는 패턴(예: 주간, 월간, 연간 등).
- 이 선은 예측된 값의 중앙값으로, 모델이 가장 가능성이 높다고 판단한 값입니다.
2. 빨간색 영역 (신뢰 구간, Prediction Interval)
- 빨간색 영역은 Prophet 모델의 예측 값(yhat)에 대한 **신뢰 구간(Confidence Interval)**을 나타냅니다.
- Prophet 모델은 예측의 불확실성을 추정하여 **상한(yhat_upper)**과 **하한(yhat_lower)**을 제공합니다.
- 신뢰 구간의 의미:
- 상한(yhat_upper): 예측 값이 이 값을 초과할 가능성은 매우 낮음.
- 하한(yhat_lower): 예측 값이 이 값보다 낮을 가능성은 매우 낮음.
- 신뢰 수준은 설정된 **신뢰 구간 파라미터(기본값: 80% 또는 95%)**에 따라 다릅니다.
- 80% 신뢰 구간: 실제 값이 이 구간 내에 포함될 확률이 80%.
- 95% 신뢰 구간: 실제 값이 이 구간 내에 포함될 확률이 95%.
- 빨간 영역의 넓이는 예측 값의 불확실성을 나타냅니다:
- 좁을수록 모델의 예측이 신뢰할 만함.
- 넓을수록 데이터의 변동성이 크거나, 예측 불확실성이 높음.
3. 노란 점 (실제 값)
- 노란 점은 시계열 데이터에서 실제 측정된 값(Observed Data)을 나타냅니다.
- Prophet 모델의 성능을 평가하려면 노란 점이 파란 선(예측 값)에 얼마나 가까운지, 빨간색 영역(신뢰 구간) 내에 포함되는지를 확인해야 합니다:
- 빨간 영역 안에 노란 점이 포함: 예측이 신뢰 구간 내에서 이루어졌음을 의미.
- 빨간 영역 밖에 노란 점이 위치: 모델이 해당 시점의 예측에 실패했거나 데이터에 변동성이 심함.
4. 이 차트를 분석하는 방법
- 파란색 선과 노란 점의 차이: 예측 정확도를 나타냅니다.
- 차이가 작을수록 모델이 데이터를 잘 설명하고 있음을 의미.
- 빨간색 영역의 넓이:
- 좁을수록 모델의 불확실성이 적고 신뢰성이 높음.
- 넓을수록 불확실성이 크고, 변동성이 높은 데이터임을 암시.
<aside>
💡
“신뢰 구간을 줄이는 것이 항상 좋은 예측을 의미하지는 않습니다.”
좁은 신뢰 구간은 예측 정확도가 높아 보일 수 있지만, 실제 데이터가 구간 밖으로 벗어나면 신뢰성이 떨어지게 됩니다. 과거 데이터가 큰 변동성을 가지고 있다면 신뢰 구간을 줄이는 것은 오히려 잘못된 선택이 될 수 있습니다. 과거 데이터의 변동성이 작고, 미래에도 유사한 패턴이 유지될 것으로 예상될 때에 신뢰 구간을 줄이는 것을 고려해보시기 바랍니다.
</aside>