라플라스 스무딩

🏷️ 정보 머신러닝

라플라스 스무딩

라플라스 스무딩(Laplace Smoothing)은 확률 추정 시 모든 범주에 가상의 관측값 1개(또는 \(\alpha\)개)를 추가하여, 훈련 데이터에서 한 번도 등장하지 않은 범주에 대해 확률 0이 되는 문제를 방지하는 기법이다.

핵심

수식

\[P(x_j = v | y = c) = \frac{\text{count}(x_j = v, y = c) + \alpha}{\text{count}(y = c) + \alpha \cdot |V|}\]