AI/빅데이터분석기사(통계)
[빅데이터 분석기사 실기] 작업1유형 2.정규표현식과 Raw string, Formatted string literal
brave_sol
2024. 11. 25. 19:07
1. 정규표현식이란?
- 텍스트 데이터에서 원하는 규칙에 맞는 문자열을 찾거나 수정하기위해 사용하는 도구
2. 주요 정규식
구분 | 정규식 | 의미 |
문자/숫자/특수문자 | [abc] | a,b,c중 하나 |
[^abc] | a,b,c가 아닌 문자 | |
[0-9] 또는 \d | 숫자 | |
[^0-9] 또는 \D | 문자 | |
[a-z] | 소문자 알파벳 | |
[A-Z] | 대문자 알파벳 | |
[a-zA-Z] | 대소문자 알파벳 | |
[a-zA-Z0-9_] 또는 \w | 문자,숫자,_ | |
[^a-zA-Z0-9_] 또는 \W | 특수문자 | |
\s | 공백(' ', \t, \n) | |
\S | 공백이 아닌 문자(문자,숫자,특수문자) | |
조건 | . | 임의의 한 글자 |
^ | 문자열의 시작 | |
$ | 문자열의 끝 | |
원하는 글자{n} | n번 반복 | |
원하는 글자{n,m} | 최소 n번, 최대 m번 반복 |
3. r"문자열"
- Raw String
- 문자열 내의 이스케이프 문자(\)를 그대로 처리
- 정규식, 파일 경로 등 사용
4. f"문자열"
- 문자열 내에 변수 값이나 표현식을 직접 삽입
- 동적으로 생성되는 문자열에 사용
- r과 혼합해 사용 가능 rf"문자열"
반응형