AI/데이터분석
[데이터분석] 시계열 데이터의 특성과 평가 지표
brave_sol
2024. 12. 1. 19:30
1. 시계열 데이터란?
- 시간의 흐름에 따라 관측된 데이터
- 데이터는 시간 순서대로 정렬되어 있으며, 각 관측치는 특정 시점에서 수집된 값
- 과거 데이터를 기반으로 미래를 예측하거나, 패턴과 변화를 분석하는데 사용된다.
2. 시계열 데이터의 주요 특성
추세(Trend) | 계절성(Seasonality) | 주기성(Cycle) | 우연 변동(Random Variation) |
![]() |
![]() |
![]() |
![]() |
지속적으로 증가(↗) 하거나 감소(↙) |
주별, 월별, 계절별 등 일정한 비교적 짧은 주기가 반복 |
일정하지 않은 주기로, 주기가 긴 경우의 변동 |
랜덤하게 발생 추세와 계절성을 제거 후 관찰 |
3. 평가 지표
MAE | RMSE | SMAPE |
![]() |
![]() |
![]() |
계산이 간단하고 직관적 데이터 단위로 해석 가능 |
큰 오차에 더 높은 가중치를 부여 데이터 단위로 복원 |
단위와 무관하고 오차를 비율로 나타냄, 대칭적으로 정의되어 실제값과 예측값이 서로 뒤바뀌어도 동일한 결과 제공 |
※ 우리 프로젝트의 경우 일사량(분모)이 0인 경우가 많아 SMAPE는 제외하였다.
반응형