본문 바로가기 메뉴 바로가기

용감해지고 싶은 쫄보의 도전기

프로필사진
  • 글쓰기
  • 관리
  • 태그
  • 방명록
  • RSS

용감해지고 싶은 쫄보의 도전기

검색하기 폼
  • 분류 전체보기 (259) N
    • AI (255) N
      • 정보처리기사(C언어) (7)
      • 빅데이터분석기사(통계) (15)
      • ERP (2) N
      • CS (16) N
      • Python (54)
      • SQL (32)
      • 데이터분석 (15)
      • 딥러닝 (12)
      • MLOps (17)
      • AI 서비스 개발 (76)
      • 기술면접준비 (6)
      • projects (0)
  • 방명록

파인튜닝 (1)
[AI 서비스 개발] LLM의 Reasoning, Deepseek R1, 파인튜닝과 강화학습

1. Reasoning(추론)- 일반 모델(GPT-4o) : 질문 → 답- 추론 모델(GPT-O1): 질문 → 생각 → 답 1) 특징- 통계적 패턴에 기반해, 논리적으로 일관성 있는 응답을 생성하는 능력- 정답보다는 과정을 생성하는 능력- 대표적인  추론: Chain-of-Thought- LLM은 암산이 어렵다- Transformer 디코더 구조: 확률적인 단방향- Dependency가 앞에만 존재(순차적으로 생성하면서 생각을 구성하는 구조) 2) 어떻게 문제를 풀까? OpenAI-o1의 출력은 6개의 패턴으로 분류된다.- 전체적인 구조 파악- 알려진 문제 해결법 적용- 하위 문제 분할- 자체 평가와 수정- 추가 문맥 활용- 제약 조건 강조=> 6개의 능력을 발휘하려면 출력이 길어야 한다. 모델에게 생각..

AI/AI 서비스 개발 2025. 3. 11. 21:11
이전 1 다음
이전 다음
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
TAG
  • 아침
  • 스크랩
  • llm
  • 습관
  • 영어회화
  • 운동
  • 다이어트
  • 오픽
  • 티스토리챌린지
  • 뉴스
  • 프로그래머스
  • C언어
  • 30분
  • 오블완
  • Python
  • 고득점 Kit
  • opic
  • SQL
  • 줄넘기
  • 경제
  • 미라클모닝
  • 빅데이터 분석기사
  • IH
  • ChatGPT
  • 실기
  • 갓생
  • 아침운동
  • 루틴
  • 기초
  • Ai
more
«   2025/05   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
글 보관함

Blog is powered by Tistory / Designed by Tistory

티스토리툴바