파인튜닝

🏷️ LLM 머신러닝

파인튜닝(fine-tuning, 미세조정)은 사전 훈련된 모델의 가중치를 출발점으로 삼아, 더 작은 도메인·태스크 데이터로 추가 학습시키는 기법이다. 처음부터 학습하는 것보다 훨씬 적은 데이터와 비용으로 특정 용도에 최적화된 모델을 얻을 수 있다.

대표적인 형태로 모든 가중치를 갱신하는 풀 파인튜닝, 일부 어댑터만 학습하는 LoRA·QLoRA 같은 PEFT(Parameter-Efficient Fine-Tuning) 계열, 사람의 선호 데이터로 정렬하는 RLHF·DPO 등이 있다. LLM 시대에는 메모리 효율 때문에 LoRA·QLoRA가 사실상 표준 도구로 자리 잡았다.

기업 환경에서는 사내 문서·고객 응대 로그·코드베이스 등으로 베이스 모델을 자기 데이터에 맞게 다듬는 용도로 자주 쓰인다. 다만 RAG로 해결되는 경우도 많아, 파인튜닝과 RAG 중 어느 쪽이 더 적합한지를 먼저 따지는 것이 일반적인 의사결정 순서다.