<Original Paper Link>
InfoGAN: Interpretable Representation Learning by Information Maximizing Generative Adversarial Nets
<aside> ๐ก InfoGAN์ ๊ธฐ์กด์ GAN์์ ์ ๋ณด์ด๋ก ์ ์ธ ํ์ฅ์ ์ถ๊ฐํ์ฌ ๋น์ง๋ ๋ฐฉ์์ผ๋ก disentangled representation (์ ์ฌ ๊ณต๊ฐ์์์ ๋ฒกํฐ ์ด๋์ ์๋ฏธ๋ฅผ ํ์ )์ ํ์ตํ๋๋ก ํ๋ค.
์ด๋ ์ ์ฌ ๋ฒกํฐ์ ๋ณ์์ ์ค์ ์์ฑ output์ผ๋ก ๊ด์ธกํ ์ ์๋ ์ด๋ฏธ์ง ๊ฐ์ ์ํธ์ ๋ณด๋์ ์ต๋ํ ํ๋ ๋ฐฉ์์ผ๋ก ์๋ํ๋ค. ์ํธ ์ ๋ณด๋์ ์ ํํ ์ถ์ ํ๋ ๊ฒ์ ์ฌํ(posterior) ํ๋ฅ ๋๋ฌธ์ ์ฝ์ง ์์ผ๋ฏ๋ก, ๋ณด์กฐ ๋ถํฌ๋ฅผ ํ์ฉํด ๊ทผ์ฌํ ๋ค, ํํ์ ์ ์ ํด ์ด๋ฅผ ๋์ด๋ ๋ฐฉ์์ผ๋ก ํ๋ค.
์ด๋ฅผ ํตํด MNIST ๋ฐ์ดํฐ์์ ์ซ์ ํด๋์ค ๋ฟ๋ง ์๋๋ผ, ํ์ , ๊ธ์จ ๋๊ป ๋ฑ์ ๋ํ ๋ณํ ๋ฒกํฐ๋ฅผ ์ฐพ์๋ผ ์ ์๊ณ , SVHN, CelebA ๋ฐ์ดํฐ์ ์์๋ ์ ์ฌ ๊ณต๊ฐ์ ๋ํ ๋ฒกํฐ๋ฅผ ํด์ํ ์ ์๋ ํํ๋ก ๋ณํ ๊ฐ๋ฅํ ๊ฒ์ ๋ณด์ฌ, ํ์ฌ ์ง๋ ํ์ต ๋ฐฉ์ ๋๋น ๊ฒฝ์๋ ฅ ์์์ ๋ณด์.
</aside>
<aside> ๐ก .
์ด๋ฒ ๋ ผ๋ฌธ์์๋ GAN ๋คํธ์ํฌ์ ์ฝ๊ฐ์ ์์ ์ ํตํด ํ์ต๋ชฉํ์ ํด์ ๊ฐ๋ฅํ๊ณ ์๋ฏธ์๋ ํํ์ ํ์ตํ๋๋ก ํ๋ ๋ฐฉ๋ฒ์ ๋ณด์ฌ์ค. GAN์ ์ ์ฌ ๋ฒกํฐ์ ์ผ๋ถ๋ถ๊ณผ ์ด๋ก ์ธํด ์ถ๋ ฅ๋ ๊ฒฐ๊ณผ๋ฌผ์ ์ํธ ์ ๋ณด๋์ ์ต๋ํ.
โ ์ํธ ์ ๋ณด๋์ ์์ฑ ๋ชจ๋ธ์ ํฌํจํ๋ ๊ฒ์ด disentagled representation์ ์์ด ๋งค์ฐ ์๋ฏธ์์์ ์ ์.