1. 트리 기반 모델트리 사용 차이점의사결정나무앙상블-배깅(Random Forest)앙상블-부스팅(GBM)나무 갯수1개여러 개여러 개학습 데이터원본*랜덤 복원 추출(크기는 같음)처음 트리엔 원본 데이터→ 다음 트리부턴 잔차(실체-예측)노드 분할시 피처사용전체 피처 고려랜덤으로 뽑아 그 중 최고 피처 선택랜덤으로 뽑아그 중 최고 피처 선택나무 학습방식단일 모델 학습각 트리가 독립적으로병렬 학습이전 트리의 오류를순차적으로 학습예측결과단일 트리 결과각 트리 결과 평균(회귀모델)각 트리 결과 투표(분류보델)각 트리 결과 합(잔차 보정)예측 결과 예시점수 예측 모델트리 1 = 90점트리1 = 85점트리2 = 75점최종 예측 = (85+75)/2트리1 = 70점트리2 = 10점 (잔차 보정)트리 3 = 5점 (잔차..
1. 시계열 데이터란?- 시간의 흐름에 따라 관측된 데이터- 데이터는 시간 순서대로 정렬되어 있으며, 각 관측치는 특정 시점에서 수집된 값- 과거 데이터를 기반으로 미래를 예측하거나, 패턴과 변화를 분석하는데 사용된다. 2. 시계열 데이터의 주요 특성추세(Trend)계절성(Seasonality)주기성(Cycle)우연 변동(Random Variation)지속적으로 증가(↗) 하거나 감소(↙)주별, 월별, 계절별 등 일정한비교적 짧은 주기가 반복일정하지 않은 주기로,주기가 긴 경우의 변동랜덤하게 발생추세와 계절성을 제거 후 관찰 3. 평가 지표MAERMSESMAPE계산이 간단하고 직관적데이터 단위로 해석 가능큰 오차에 더 높은 가중치를 부여데이터 단위로 복원단위와 무관하고 오차를 비율로 나타냄,대칭적으로 정..
- Total
- Today
- Yesterday
- 스크랩
- 루틴
- 오블완
- 고득점 Kit
- 빅데이터 분석기사
- 다이어트
- 운동
- 티스토리챌린지
- opic
- 아침
- 기초
- 습관
- C언어
- Python
- 30분
- 프로그래머스
- IH
- 줄넘기
- 미라클모닝
- 뉴스
- Ai
- 경제
- 오픽
- 실기
- SQL
- 아침운동
- 영어회화
- ChatGPT
- 갓생
- llm
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |