1. VAE(Variational AutoEncoder)의 개요
가. 정의
입력 데이터의 통계적 특성(평균과 분산)을 추출하여 잠재 변수(Latent Variable)의 확률 분포를 학습하고, 이 분포로부터 새로운 샘플을 생성해내는 확률론적 생성 모델입니다.
나. 일반적인 AutoEncoder(AE)와의 차이점
AE: 데이터를 특정 점(Point)으로 압축하여 복원에 집중 (차원 축소 목적).
VAE: 데이터를 확률 분포(Distribution)로 매핑하여 분포 내 임의의 지점에서 새로운 데이터 생성 가능 (생성 목적).
2. VAE의 아키텍처 및 핵심 메커니즘
VAE는 인코더가 직접 잠재 벡터를 만드는 대신, 분포의 파라미터를 추정하는 구조를 가집니다.
가. 주요 구성 요소
Encoder (Recognition Model): 입력 데이터 $x$를 받아 잠재 공간의 평균($\mu$)과 분산($\sigma$)을 출력.
Latent Space ($z$): 평균과 분산으로 정의된 가우시안 분포 $q(z|x)$.
Decoder (Generative Model): 잠재 공간에서 샘플링된 $z$를 다시 원래 데이터 공간 $\hat{x}$로 복원.
나. 재매개변수화 기법 (Reparameterization Trick)
확률적인 샘플링 과정은 미분이 불가능하여 역전파(Backpropagation)를 수행할 수 없습니다.
이를 해결하기 위해 $z = \mu + \sigma \odot \epsilon$ (단, $\epsilon \sim N(0, I)$)으로 분리하여, 학습 가능한 파라미터와 노이즈를 분리함으로써 경사하강법 적용을 가능하게 합니다.
3. VAE의 손실 함수 (Loss Function)
VAE의 학습 목표는 **ELBO(Evidence Lower Bound)**를 최대화하는 것이며, 손실 함수는 두 부분의 합으로 구성됩니다.
| 항목 | 의미 | 역할 |
| Reconstruction Loss | 입력 $x$와 복원된 $\hat{x}$ 사이의 차이 | 데이터의 특징을 얼마나 잘 보존하는지 측정 (MSE 등) |
| KL Divergence | 학습된 분포 $q(z | x)$와 표준정규분포 $p(z)$ 사이의 거리 |
4. VAE와 GAN의 비교
| 비교 항목 | VAE (Variational AutoEncoder) | GAN (Generative Adversarial Network) |
| 모델 유형 | 확률론적 모델 (Likelihood-based) | 결정론적 모델 (Adversarial-based) |
| 학습 방식 | 비지도 학습 (ELBO 최적화) | 경쟁 학습 (Generator vs Discriminator) |
| 특징 | 잠재 공간이 연속적이고 해석 가능함 | 생성물의 품질이 매우 정교함 |
| 장점 | 학습이 안정적이고 데이터 분포 파악 용이 | 실사 이미지와 유사한 고해상도 생성 가능 |
| 단점 | 생성된 이미지가 다소 흐릿함(Blurry) | 학습이 불안정하고 Mode Collapse 발생 가능 |
5. 기술사적 제언: VAE의 확장 및 활용 전략
차세대 생성 모델의 기반: 최근 주목받는 Stable Diffusion 모델에서 고해상도 이미지를 저차원 잠재 공간으로 투영하는 **LDM(Latent Diffusion Model)**의 핵심 인코더로 VAE가 사용됩니다.
이상 탐지(Anomaly Detection): 정상 데이터의 분포를 학습한 후, 재구축 오차(Reconstruction Error)가 큰 데이터를 이상치로 판별하는 산업 현장의 품질 관리 도구로 활용 가능합니다.
데이터 증강(Data Augmentation): 데이터가 부족한 도메인(의료 데이터 등)에서 원본의 통계적 특성을 유지한 채 가상 데이터를 생성하여 모델의 성능을 보완하는 전략이 유효합니다.
댓글 없음:
댓글 쓰기