학습 곡선
학습 곡선
학습 곡선(Learning Curve)은 훈련 데이터의 크기를 늘려가면서 훈련 오류와 검증 오류를 함께 플롯하여, 모델의 편향(bias)과 분산(variance) 문제를 시각적으로 진단하는 도구이다.
핵심
- 훈련 오류와 검증 오류가 모두 높으면 높은 편향(과소적합) 문제
- 훈련 오류와 검증 오류 사이에 큰 차이가 있으면 높은 분산(과적합) 문제
- 데이터를 더 추가해도 개선이 없으면 높은 편향이 원인임을 알 수 있다
- 높은 분산은 더 많은 데이터, 정규화, 모델 단순화로 해결한다
- 높은 편향은 더 복잡한 모델, 추가 특징 생성으로 해결한다