AI 원리 이해하기

언어 모델의 토대

LLM: 대규모 언어 모델, 요즘 AI의 중심
트랜스포머: 현대 언어 모델의 기본 구조
어텐션 메커니즘: 문맥에서 중요한 부분에 집중하는 방식
셀프 어텐션: 문장이 스스로를 참고하는 어텐션
위치 인코딩: 순서 정보를 모델에 넣는 법
토큰화: 문장을 모델이 읽는 단위로 쪼개기
임베딩: 단어와 의미를 숫자 벡터로 표현
사전 훈련: 대량 데이터로 기본기를 만드는 단계

머신러닝과 딥러닝

퍼셉트론: 신경망의 가장 작은 단위
역전파: 신경망이 오차로부터 배우는 방식
지도 학습: 정답을 주며 가르치기
비지도 학습: 정답 없이 패턴을 찾게 하기
강화 학습: 보상으로 행동을 다듬기
편향-분산 트레이드오프: 과소적합과 과적합 사이
정규화: 모델이 과하게 외우지 않게 하기
자연어 처리: 컴퓨터가 사람의 말을 다루는 분야
확산 모델: 이미지 생성 AI의 원리
RAG: 외부 지식을 검색해 답에 반영
파인튜닝: 기존 모델을 특정 작업에 맞추기

최신 이론

연쇄 사고: 단계를 밟아 추론하게 하기
RLHF: 사람 피드백으로 모델을 정렬하기
GRPO: 보상 모델 없이 정책을 최적화하는 강화학습
혼합 전문가 모델: 필요한 전문가만 켜서 키우는 구조
증류: 큰 모델의 지식을 작은 모델로 옮기기
양자화: 정밀도를 낮춰 모델을 가볍게
창발(Emergence): 규모가 커지며 새 능력이 나타나는 현상