사전 훈련

🏷️ 정보 LLM

사전 훈련

사전 훈련(Pre-training)은 수조 토큰 규모의 대규모 텍스트 데이터로 언어의 구조, 지식, 추론 능력을 학습하는 LLM 훈련의 첫 번째 단계이다. 다음 토큰 예측(next token prediction)이 주요 학습 목표이다.

핵심