본문 바로가기 메뉴 바로가기

용감해지고 싶은 쫄보의 도전기

프로필사진
  • 글쓰기
  • 관리
  • 태그
  • 방명록
  • RSS

용감해지고 싶은 쫄보의 도전기

검색하기 폼
  • 분류 전체보기 (260) N
    • AI (256) N
      • 정보처리기사(C언어) (7)
      • 빅데이터분석기사(통계) (15)
      • ERP (2)
      • CS (16)
      • Python (54)
      • SQL (33) N
      • 데이터분석 (15)
      • 딥러닝 (12)
      • MLOps (17)
      • AI 서비스 개발 (76)
      • 기술면접준비 (6)
      • projects (0)
  • 방명록

search (1)
[AI 서비스 개발] RAG을 위한 PDF load, 텍스트 분할과 Embedding

1. 진행 순서- PDF를 참고해서 답변하는 chatbot을 만들고 싶은데, 답별할 때 해당 정보가 있는 page 번호를 알려줬으면 했다.- 원래 페이지 번호를 정상적으로 가져오는 경우도 있지만, 나의 경우에는 에러가 나서 따로 페이지번호를 추가해줬다.PDF 파일 로드 > 페이지 번호 추가(메타데이터) > 텍스트 분할 (문장) > 임베딩 > 벡터 데이터베이스 저장/로드 > 검색 쿼리 및 결과 출력 > 테스트 2. pdf 파일 로드와 페이지 번호 추가# 1. PDF 로드loader = PyPDFLoader("2021_Guidelines_Beer.pdf")documents = loader.load()# 2. 각 페이지에 페이지 번호 추가for i, doc in enumerate(documents): d..

AI/AI 서비스 개발 2024. 12. 11. 23:32
이전 1 다음
이전 다음
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
TAG
  • 뉴스
  • 미라클모닝
  • 빅데이터 분석기사
  • 30분
  • 고득점 Kit
  • C언어
  • 기초
  • 실기
  • ChatGPT
  • 티스토리챌린지
  • 루틴
  • 아침운동
  • llm
  • SQL
  • Ai
  • 운동
  • 경제
  • opic
  • 갓생
  • Python
  • 줄넘기
  • 오블완
  • 습관
  • 다이어트
  • 아침
  • IH
  • 프로그래머스
  • 영어회화
  • 스크랩
  • 오픽
more
«   2025/05   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
글 보관함

Blog is powered by Tistory / Designed by Tistory

티스토리툴바