티스토리 뷰
[1] 사분위수
1. 정의
데이터를 정렬하고 4개의 동일한 부분으로 나눈 값
1) Q0: 최소값 (0% 지점) : 데이터셋의 최솟값
2) Q1: 1사분위수 (하위 25% 지점) : Q1의 위치: (n+1)/4
3) Q2: 중앙값 또는 2사분위수 (50% 지점)
- 데이터셋의 개수(n)가 홀수인 경우: (n+1)/2 위치의 값
- 데이터셋의 개수(n)가 짝수인 경우: ( (n/2) + (n/2+1) ) / 2 위치의 값
4) Q3: 3사분위수 (하위 75% 지점, 즉 상위 25%) : 3/4 * (n+1)
5) Q4: 최대값 (100% 지점) : 데이터셋의 최댓값
2. 선형보간법
- 보간(Interpolation): 두 개의 값 사이에 있는 위치에서 값을 추정하는 방법
- 선형보간법 : 두 점 사이의 직선을 따라 중간값을 추정하는 보간 방법
두 점 (x0,y0)와 (x1,y1)사이의 중간점 (x,y)를 구하는 방법
y=y0+(x1−x0)(y1−y0)×(x−x0)
3. 예시
데이터셋 a= [10,20,30,40,50,60,70,80,90,100] 일 경우
데이터셋의 크기 n 은 10
1) Q0: 최소값 (0% 지점) : 10
2) Q1: 1사분위수 (25% 지점)
- Q1의 위치: (10+1)/4 = 2.75이므로 2번째 값(20)과 3번째 값(30) 사이에 있다.
소수부분 0.75을 이용해 보간값을 계산하면,
- Q1=20+0.75×(30−20)=20+0.75×10=20+7.5=27.5
3) Q2: 중앙값 또는 2사분위수 (50% 지점)
- 데이터셋이 짝수이므로 (50+60)/2 = 55
4) Q3: 3사분위수 (75% 지점)
- 3/4 * (n+1) = 3/4*11 = 8.25, Q3의 위치는 8번째 값(80)과 9번째 값(90) 사이에 있다.
보간 값을 계산하기 위해 소수부분 0.25를 이용하면
Q3 = a8+0.25 * (a9-a8) = 80 + 0.25*(90-80) = 82.5
5) Q4: 최대값 (100% 지점) : 100
[2] 표준편차
1. 정의
데이터가 평균을 중심으로 얼마나 퍼져 있는지를 측정합니다. 표준편차가 작을수록 데이터가 평균에 가깝게 몰려 있다.
2. 계산방법
표준편차= 분산(Variance)의 제곱근(루트, 또는 1/2제곱) = (데이터-평균)의 평균의 제곱근
1) 분산(Variance): 데이터가 평균으로부터 얼마나 떨어져 있는지의 제곱 평균
2) 분산 계산방법: 평균 계산 → 편차제곱(데이터-평균)^2 계산 → 편차제곱의 평균 계산
예시) 데이터셋: [10,20,30,40,50]
- 평균 = (10+20+30+40+50)/5 = 30
- 편차 제곱 = [(10-30)^2=400, (20-30)^2=100, (30-30)^2=0, (40-30)^2=100, (50-30)^2=400]
- 편차 제곱의 평균 = (400+100+0+100+400)/5 = 200
3) 표준편차 = 200^(1/2) = 약 14.14
'AI > 빅데이터분석기사(통계)' 카테고리의 다른 글
[빅데이터 분석기사 실기] 작업1유형 1.전처리 함수 (1) | 2024.11.23 |
---|---|
[빅데이터 분석기사 실기] 9회 실기 시험 준비(시험 환경 확인) (0) | 2024.11.20 |
[빅데이터 분석기사 실기] 작업형3유형 2.로지스틱 회귀모델 (1) | 2024.11.19 |
[빅데이터 분석기사 실기] 작업형3유형 1.통계적검정 (0) | 2024.11.19 |
[빅데이터 분석기사 실기] 4회기출 작업형1유형 연습문제 풀이 (0) | 2024.11.17 |
- Total
- Today
- Yesterday
- Ai
- 오블완
- 아침운동
- ChatGPT
- opic
- 티스토리챌린지
- IH
- 영어회화
- 루틴
- 다이어트
- 실기
- 뉴스
- 오픽
- SQL
- llm
- 30분
- 미라클모닝
- 아침
- 빅데이터 분석기사
- 갓생
- 운동
- 기초
- Python
- 스크랩
- 줄넘기
- 습관
- C언어
- 프로그래머스
- 고득점 Kit
- 경제
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |