K-겹 교차 검증
K-겹 교차 검증
K-겹 교차 검증(K-fold Cross Validation)은 데이터를 \(K\)개의 동등한 크기의 폴드(fold)로 나눈 후, 매 반복마다 하나의 폴드를 검증 세트로 사용하고 나머지 \(K-1\)개의 폴드로 훈련하는 방식으로 \(K\)번 반복하는 방법이다.
핵심
- 각 데이터 포인트가 정확히 한 번 검증 세트로 사용된다
- \(K\)개의 검증 점수를 평균내어 모델 성능을 추정한다
- \(K=m\) (데이터 수)이면 LOO(Leave-One-Out) 교차 검증이 된다
- \(K=5\) 또는 \(K=10\)이 일반적으로 좋은 균형을 제공한다
- 단순 홀드아웃보다 더 안정적인 성능 추정이 가능하지만 훈련 비용이 \(K\)배 든다