교차 검증
교차 검증
교차 검증(Cross-Validation)은 데이터를 여러 방식으로 훈련 세트와 검증 세트로 분할하여 모델의 일반화 성능을 더 신뢰성 있게 추정하는 방법이다. 단순 홀드아웃과 K-겹 교차 검증이 대표적이다.
핵심
- 단순 홀드아웃: 전체 데이터를 훈련(70%), 검증(15%), 테스트(15%) 등으로 한 번만 분할
- K-겹 교차 검증: 데이터를 K개의 폴드로 나눠 K번 순환하며 검증
- 하이퍼파라미터 선택, 모델 비교 등에 활용된다
- 데이터가 적을 때 더 안정적인 성능 추정이 가능하다
- 테스트 세트는 최종 평가에만 사용하고 검증 중에는 보지 않아야 한다