티스토리 뷰
- 패키지마다 의존성이 다르기 때문에 가상환경 생성해서 새로 하는 것이 좋음
1. easy OCR : https://github.com/JaidedAI/EasyOCR/blob/master/examples/easyocr_framework.jpeg
- 성능을 높이기 위해 재학습 시키거나 재학습한 모델을 사용하는 것이 좋음
2. CRAFT : Text Detection 단계에서 사용하는 모델, 문자 영역을 감지
- 텍스트가 위치한 영역의 바운딩 박스를 반환하며, 이후 단계에서 텍스트를 인식(Recognition)하는데 도움을 준다
3. 패키지 설치
pip install easyocr
4. 사용: Task에 따라 데이터/모델만 갈아 끼우면 됨
# step1: 모듈 불러오기
import easyocr
# step2: 추론기 만들기
reader = easyocr.Reader(['ko','en']) # this needs to run only once to load the model into memory
# ste3: 데이터 불러오기
data = 'korean.png'
# step4: 추론하기
# detail은 0 : 위치정보 필요 없을 때
result = reader.readtext(data, detail=0)
print(result)
# step5: 후처리 post processing (예: pdf에서 개인정보 찾기)
# if dddd = "주민등록등본":
5. recognition 따로 학습 시키고 싶다면: AI 허브 데이터 활용
- https://www.aihub.or.kr/aihubdata/data/view.do?currMenu=&topMenu=&aihubDataSe=data&dataSetSn=632
반응형
'AI > AI 서비스 개발' 카테고리의 다른 글
[AI 서비스 개발] 자연어처리, 허깅페이스 Transformers (4) | 2024.12.29 |
---|---|
[AI 서비스 개발] 사진 해석 (Image captioning) (3) | 2024.12.29 |
[AI 서비스 개발] 안면인식 (1) | 2024.12.28 |
[AI 서비스 개발] 개발 환경 설정 (1) | 2024.12.28 |
[AI 서비스 개발] AI 모델 트렌드 파악하기, 허깅스페이스, 미디어파이프라인 (2) | 2024.12.28 |
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- 줄넘기
- 아침
- llm
- 갓생
- ChatGPT
- 운동
- Ai
- 빅데이터 분석기사
- 미라클모닝
- 실기
- 프로그래머스
- 뉴스
- SQL
- 경제
- 루틴
- 스크랩
- C언어
- 티스토리챌린지
- 오블완
- 기초
- 영어회화
- opic
- 30분
- Python
- IH
- 아침운동
- 다이어트
- 습관
- 오픽
- 고득점 Kit
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
글 보관함