Limit(0): 확률적 잠재 공간 학습을 통한 데이터 생성, VAE(Variational AutoEncoder)

2026년 3월 31일 화요일

입력 데이터의 통계적 특성(평균과 분산)을 추출하여 잠재 변수(Latent Variable)의 확률 분포를 학습하고, 이 분포로부터 새로운 샘플을 생성해내는 확률론적 생성 모델입니다.

VAE는 인코더가 직접 잠재 벡터를 만드는 대신, 분포의 파라미터를 추정하는 구조를 가집니다.

Encoder (Recognition Model): 입력 데이터 $x$ 를 받아 잠재 공간의 평균( $\mu$ )과 분산( $\sigma$ )을 출력.
Latent Space ( $z$ ): 평균과 분산으로 정의된 가우시안 분포 $q(z|x)$ .
Decoder (Generative Model): 잠재 공간에서 샘플링된 $z$ 를 다시 원래 데이터 공간 $\hat{x}$로 복원.

확률적인 샘플링 과정은 미분이 불가능하여 역전파(Backpropagation)를 수행할 수 없습니다.
이를 해결하기 위해 $z = \mu + \sigma \odot \epsilon$ (단, $\epsilon \sim N(0, I)$ )으로 분리하여, 학습 가능한 파라미터와 노이즈를 분리함으로써 경사하강법 적용을 가능하게 합니다.

VAE의 학습 목표는 **ELBO(Evidence Lower Bound)**를 최대화하는 것이며, 손실 함수는 두 부분의 합으로 구성됩니다.

Loss = \text{Reconstruction Loss} + \text{KL Divergence}

비교 항목	VAE (Variational AutoEncoder)	GAN (Generative Adversarial Network)
모델 유형	확률론적 모델 (Likelihood-based)	결정론적 모델 (Adversarial-based)
학습 방식	비지도 학습 (ELBO 최적화)	경쟁 학습 (Generator vs Discriminator)
특징	잠재 공간이 연속적이고 해석 가능함	생성물의 품질이 매우 정교함
장점	학습이 안정적이고 데이터 분포 파악 용이	실사 이미지와 유사한 고해상도 생성 가능
단점	생성된 이미지가 다소 흐릿함(Blurry)	학습이 불안정하고 Mode Collapse 발생 가능

차세대 생성 모델의 기반: 최근 주목받는 Stable Diffusion 모델에서 고해상도 이미지를 저차원 잠재 공간으로 투영하는 **LDM(Latent Diffusion Model)**의 핵심 인코더로 VAE가 사용됩니다.
이상 탐지(Anomaly Detection): 정상 데이터의 분포를 학습한 후, 재구축 오차(Reconstruction Error)가 큰 데이터를 이상치로 판별하는 산업 현장의 품질 관리 도구로 활용 가능합니다.
데이터 증강(Data Augmentation): 데이터가 부족한 도메인(의료 데이터 등)에서 원본의 통계적 특성을 유지한 채 가상 데이터를 생성하여 모델의 성능을 보완하는 전략이 유효합니다.

Limit(0)