Conditional Generative Adversarial Nets
Introduction
- DCGAN(2016) 이전에 나온 논문으로, CNN 기반이 아닌 MLP 기반 모델이다.
- GAN은 많은 난해한 probabilistic computations를 근사화하는 어려움을 피하기 위해 생성 모델을 훈련하기 위한 대안 프레임워크로 도입됨. Markov chains가 필요하지 않은 장점이 있으며 backpropagation만이 gradient를 구하기 위해 사용된다.
- GAN은 SOTA log-likelihood estimates와 realistic samples를 생성할 수 있다.
- GAN의 conditional version이라고 할 수 있다. y라는 조건/추가정보(e.g. class label )을 G와 D에 준다.
- MNIST 데이터로 실험했으며
- multi model 모델 학습의 활용을 보여주고 이 접근방식(CGAN)이 training labels의 일부가 아닌 descriptive tags를 생성하는 방법을 보여주는 image tagging에 대한 적용예시도 보여준다
3. Conditional Adversarial Nets
3.1 GAN
G : data distribution을 capture
D: sample이 G가 아니라 sample data에서 왔을 확률을 예측
G와 D는 non-linear mapping function일 수 있다 ( multi-layer perceptron처럼 ( MLP처럼 ) )


3.2 CGAN
GAN의 conditional model로서의 확장
G와 D가 몇 extra information인 y로 conditioned되었을 경우
- y : 어떤 종류던간에 추가 정보 (auxiliary information) (e.g. 다른 modalities에서 나온 class labels)