연쇄 사고
연쇄 사고
연쇄 사고(Chain-of-Thought, CoT)는 LLM이 최종 답변을 내놓기 전에 중간 추론 단계를 단계별로 명시적으로 출력하게 유도하는 프롬프팅 기법이다. 복잡한 추론 과제에서 성능을 크게 향상시킨다.
핵심
- "단계별로 생각해보자(Let's think step by step)" 같은 프롬프트로 활성화할 수 있다
- 퓨샷(few-shot) CoT: 중간 추론을 포함한 예시를 프롬프트에 포함
- 제로샷(zero-shot) CoT: 추론을 명시하라는 지시만으로 활성화
- 수학, 코딩, 논리 추론 과제에서 특히 효과적이다
- 강화 학습 훈련으로 CoT를 내재화하면 추론 체인이 자동으로 생성된다 (o1, DeepSeek R1)