분류
분류
분류(Classification)는 입력 \(x\)를 유한한 이산 클래스 집합 \(\{0, 1, \ldots, k\}\) 중 하나로 예측하는 지도 학습 문제 유형이다. 스팸 메일 탐지, 이미지 인식 등이 대표적인 예이다.
핵심
- 이진 분류(binary)와 다중 클래스(multiclass) 분류로 나뉜다
- 로지스틱 회귀, SVM, 나이브 베이즈, 신경망 등이 대표 알고리즘이다
- 모델이 출력하는 확률값을 임계값으로 클래스를 결정한다
- 정밀도, 재현율, F1 점수 등으로 성능을 평가한다
- 클래스 불균형 문제가 실무에서 자주 발생한다