다변량 가우시안 분포
다변량 가우시안 분포
다변량 가우시안 분포(Multivariate Gaussian Distribution)는 \(n\)차원 연속 확률 변수의 분포로, 평균 벡터 \(\mu \in \mathbb{R}^n\)와 공분산 행렬 \(\Sigma \in \mathbb{R}^{n \times n}\)으로 완전히 정의된다.
핵심
- 타원형 등확률 윤곽선(elliptical contours)을 가진다
- 공분산 행렬 \(\Sigma\)가 변수들 간의 상관 관계를 인코딩한다
- GDA(가우시안 판별 분석)에서 각 클래스의 조건부 분포를 모델링하는 데 사용된다
- 가우시안 혼합 모델(GMM)은 여러 다변량 가우시안의 혼합으로 복잡한 분포를 표현한다
- \(\Sigma\)가 양의 정치(positive definite)이어야 정규화된 분포이다
수식
\[p(x;\mu,\Sigma) = \frac{1}{(2\pi)^{n/2}|\Sigma|^{1/2}}\exp\!\left(-\frac{1}{2}(x-\mu)^T\Sigma^{-1}(x-\mu)\right)\]