확산 모델
확산 모델
확산 모델(Diffusion Model)은 깨끗한 데이터에 점진적으로 노이즈를 추가하는 순방향 과정과, 노이즈에서 원래 데이터를 복원하는 역방향 과정을 학습하는 생성 모델이다. 이미지 생성 분야의 표준 아키텍처이다.
핵심
- 순방향: 깨끗한 이미지에 단계적으로 가우시안 노이즈를 추가하여 완전한 노이즈로 만든다
- 역방향: 노이즈에서 제거해야 할 노이즈를 예측하는 U-Net(또는 트랜스포머)을 학습한다
- 텍스트 조건화로 텍스트-이미지 생성(DALL-E, Stable Diffusion, Midjourney)이 가능하다
- 텍스트로의 적용: 마스크 토큰을 노이즈 대신 사용하는 MDM(Masked Diffusion Model) 방식
- 자기 회귀 모델보다 병렬 생성이 가능하여 추론 속도 이점이 있다