AI/데이터분석

[데이터분석] 시계열 데이터의 특성과 평가 지표

brave_sol 2024. 12. 1. 19:30

1. 시계열 데이터란?

- 시간의 흐름에 따라 관측된 데이터

- 데이터는 시간 순서대로 정렬되어 있으며, 각 관측치는 특정 시점에서 수집된 값

- 과거 데이터를 기반으로 미래를 예측하거나, 패턴과 변화를 분석하는데 사용된다.

 

2. 시계열 데이터의 주요 특성

추세(Trend) 계절성(Seasonality) 주기성(Cycle) 우연 변동(Random Variation)
지속적으로
증가(↗) 하거나 감소(↙)
주별, 월별, 계절별 등 일정한
비교적 짧은 주기가 반복
일정하지 않은 주기로,
주기가 긴 경우의 변동
랜덤하게 발생
추세와 계절성을 제거 후 관찰

 

3. 평가 지표

MAE RMSE SMAPE
계산이 간단하고 직관적
데이터 단위로 해석 가능
큰 오차에 더 높은 가중치를 부여
데이터 단위로 복원
단위와 무관하고 오차를 비율로 나타냄,
대칭적으로 정의되어 실제값과 예측값이 서로 뒤바뀌어도 동일한 결과 제공

※ 우리 프로젝트의 경우 일사량(분모)이 0인 경우가 많아 SMAPE는 제외하였다.

 

반응형