1. 특정 열의 데이터 글자 수 확인: df['컬럼명'].str.len()import pandas as pd# 글자수가 8개인지 확인df[df['신고일자'].str.len() != 8] 2. 특정 글자수가 아니면 앞에 0 채우기: str.zfill(글자수)df['신고시각'] = df['신고시각'].str.zfill(6)3. 날짜 형식으로 바꾸기: pd.to_datetime(df['컬럼명'])df['신고시간'] = pd.to_datetime(df['신고시간'])df['출동시간'] = pd.to_datetime(df['출동시간'])4. 시간 차이(데이터 타입: timedelta) 초 형식으로 바꾸기df['소요시간'] = df['소요시간'].dt.total_seconds()5. (참고) ns(나노 세컨드)를 ..
머신러닝에서 **이상치(Outlier)**는 데이터의 일반적인 패턴에서 크게 벗어난 값을 의미해요. 이상치는 모델 성능에 부정적인 영향을 줄 수 있기 때문에, 이를 적절히 처리하는 것은 중요한 단계입니다. 이 포스팅에서는 이상치의 정의와, 머신러닝 모델에서 이상치를 다루는 방법에 대해 설명하겠습니다.1. 이상치란 무엇인가?이상치는 데이터의 일반적인 분포에서 벗어난 값을 의미합니다. 이상치는 여러 가지 이유로 발생할 수 있습니다:데이터 입력 오류: 잘못된 값이 입력되었거나 측정 오류로 인해 발생.비정상적인 상황: 실제로 드물게 발생하는 극단적인 경우를 나타냄.특정 이벤트나 패턴: 외부 요인에 의해 데이터가 비정상적으로 변동하는 경우.이상치는 데이터 분석과 머신러닝 모델링에 부정적인 영향을 줄 수 있기 때문..
- Total
- Today
- Yesterday
- 미라클모닝
- llm
- 갓생
- 오픽
- 30분
- Python
- 습관
- 프로그래머스
- 티스토리챌린지
- Ai
- 고득점 Kit
- 줄넘기
- 스크랩
- 루틴
- 영어회화
- 경제
- C언어
- 아침
- 다이어트
- 오블완
- ChatGPT
- 아침운동
- 기초
- 뉴스
- 빅데이터 분석기사
- SQL
- 운동
- 실기
- IH
- opic
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |