1. 개념 비교추상화구현 세부사항을 숨기고 필요한 기능한 보여주는 개념캡슐화데이터를 은닉하고 메서드만 외부에 노출하는 구조다형성동일한 메서드를 여러 클래스에 재정의하는 구조상속성기존 클래스를 재사용해서 새로운 클래스를 만드는 구조// 1. 추상화: Animal이라는 추상 클래스(필요한 기능만 정의)abstract class Animal { private String name; // 2. 캡슐화: private 변수 (외부에서 직접 접근 못 함) public Animal(String name) { // 생성자 this.name = name; } public String getName() { // getter 메소드만 외부에 제공 return name; ..
1. PostgreSQL의 강점- SQL 표준을 더 충실히 따른다. (MySQL은 편리하지만 축약 등 비표준 문법이 꽤 있다. ex.LIMIT)- 트랜잭션 제어(BEGIN, SAVEPOINT, ROLLBACK TO)/락/ACID 특성이 더 강력- 데이터 타입이 더 다양하고 강력하다(JSON, ARRAY 같은 특수 타입을 기본 지원)- 복잡한 처리(JOIN, 서브쿼리, 윈도우 함수 등)를 훨씬 빠르고 정확하게 처리- BSD 라이선스(기업이 커스터마이징하거나 상업화 해도 거의 제약 없음)- 확장성(PostGIS, pg_partman, TimescaleDB 등으로 GIS, 파티셔닝, 시계열데이터 추가 가능)과 플러그인 가능 2. 문법 차이구분MySQLPostgreSQL순서LIMIT 10 OFFSET 20 (=..
1. 생성형 인공지능- 인공지능 기술의 한 종류로서 이미지, 비디오, 오디오, 텍스트 등을 포함한 대량의 데이터를 학습하여 사람과 유사한 방식으로 문맥과 의미를 이해하고 새로운 데이터를 자동으로 생성해주는 기술 1) 기존 AI 기술과의 차이점- 기존 AI 기술이 회귀, 분류, 군집화 등 판별적인 AI 기술이었다면, 생성형 AI 기술은 이용자가 요구한 질문이나 과제를 해결하기 위해 주어진 데이터를 기반으로 패턴과 규칙을 학습하고 이를 통해 새로운 컨텐츠를 생성하는 기술 2) LLM- 대규모 언어 모델은 일반적으로 수백억 개 이상의 파라미터를 포함하는 인공지능 모델을 의미하며, 복잡한 언어 패턴과 의미를 학습하고 다양한 추론 작업에 대해 우수한 성능을 보유 3) GPT- 대규모 언어 모델로서, 도서, 웹 문..
1. PSI란?- 예측 변수를 구간별로 나눔- 과거 데이터와 현재 데이터의 비율 차이를 각 구간별로 계산- 다음 공식을 통해 구간별 PSI를 모두 더함 2. gain chart- 모델이 상위 점수 집단에서 실제 정답을 얼마나 잘 찾아내는지를 시각화하는 그래프- 주로 마케팅, 불량 예측, 사기 탐지 등에서 우선순위 기반 타겟팅 효과를 평가할 때 유용하게 사용- 모델의 예측 점수(예: 불량 확률)를 기준으로 데이터를 내림차순 정렬 후, 상위 N% 안에 실제 정답이 얼마나 포함됐는지 누적 비율로 나타낸 그래프- 왜쓰나요? 어떤 고객이 중요할까? 어디서부터 처리할까? 같은 우선순위 깁나의 의사결정에 잘 쓰일 수 있는지를 확인- 불균형 데이터나 이진 분류 문제에 유용 3. 회귀분석- 독립변수가 종속변수에 어떤 ..
1. Wav2Vec- Facebook에서 개발한 self-Supervised 음성 표현 학습 모델- 음성 신호 → 의미 있는 벡터 임베딩으로 변환해주는 모델 1) 핵심 구조- 음성 신호에서 프레임 단위 특징 추출- transformer 구조 + self supervised 방식으로 개선해 라벨 없이 음성 표현을 미리 학습하고, 소량의 라벨 데이터로 fine-tuning이 가능- 활용 분야: 음성인식(ARS)- 목소리를 텍스트로 변환, 스피커 검증: 누가 말했는지 식별, 음성 임베딩- 음성 특성 추출하여 분류, 클러스터링 등 활용- 라벨이 없는 음성 데이터로 미리 학습 가능,작은 학습 데이터로도 높은 성능- Hugging Face의 facebook/wav2vec2-base로 바로 사용 가능 2. Speec..
1. 프롬프트 엔지니어링이란?- 생성형 AI 모델이 원하는 결과를 생성하도록 유도하는 명령어(프롬프트)를 설계하고, 최적화 하는 과정- 인간의 의도를 AI가 정확히 이해하고, 그에 맞는 출력을 생성할 수 있도록 돕는 역할 2. 주요 프롬프트 엔지니어링 기법- chain of Thought (CoT) 프롬프팅: 모델이 문제를 단계별로 해결하도록 유도하여, 복잡한 추론을 수행하게 하는 방식- ReAct: 모델이 추론과 행동을 번갈아 수행하며 복잡한 작업을 해결하도록 하는 방식- Self-Consistency Prompting(자기일관성 프롬프트 기법): 동일한 프롬프트를 여러 번 실행하여 다양한 응답을 생성하고, 그 중 가장 일관된 응답을 선택하는 방식 3. RAG- 외부 지식 소스에서 정보를 검색해, ..
1. CNN- convolutional Neural Network- 합성곱: 이미지, 영상 등 공간 정보를 갖는 데이터에 특화된 딥러닝 구조- 이미지나 시계열 데이터 등에서 특정 패턴을 찾아내기 위한 연산- 합성곱 연산을 통해 특징 추출 → 풀링(Pooling) → 분류(Fully Connected Layer)- 활용: 이미지분류, 객체 탐지, 얼굴 인식, 의료 영상 분석 등- 평가방법: Accuracy, Precision, Recall, F1-score, Confusion Matrix, Top-k Accuracy 2. RNN- 시퀀스 데이터(시간 흐름, 순서)를 처리하는 신경망- 앞 시점의 출력을 다음 시점으로 전달 → 기억 가능- 긴 시퀀스 데이터를 다룰 때 기억이 금방 사라지는 한계, 기울기소..
(1) 앙상블- 여러 모델을 결합해서 더 좋은 성능을 내는 기법 (2) 배깅- 여러 모델이 제각각 배운걸 평균내서 예측(병렬 학습)- 대표 모델: 랜덤포레스트- 결정트리 기반의 앙상블 학습 기법, 머신러닝에서 가장 널리 쓰이는 모델 중 하나- 여러 개의 결정트리를 랜덤하게 생성한 뒤, 각각의 예측을 투표(분류) 또는 평균(회귀)해서 최종 결과를 만드는 모델- 목표: 분산을 낮추는 것 (3) 부스팅- 앞에서 틀린걸 다음 모델이 고치면서 점점 똑똑해지는 방식 (순차학습)- 대표모델: XGBoost, LGBM, CatBoost - 목표: 편향을 낮추는 것 1. AdaBoost- 가장 초기의 부스팅 알고리즘 중 하나- 약한 학습기(보통 깊이 1짜리 트리)를 여러개 쌓되, 이전 모델이 틀린 데이터에 더 집중- ..
- Total
- Today
- Yesterday
- ChatGPT
- 영어회화
- 실기
- C언어
- 빅데이터 분석기사
- 경제
- 다이어트
- 줄넘기
- 기초
- 갓생
- IH
- 루틴
- Python
- 30분
- 오블완
- 프로그래머스
- SQL
- 운동
- 티스토리챌린지
- 오픽
- 아침
- llm
- 뉴스
- 아침운동
- 미라클모닝
- Ai
- opic
- 습관
- 고득점 Kit
- 스크랩
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |