架構
生成對抗網路 (GAN)
Generative Adversarial Network (GAN)
由生成器與判別器兩個模型互相對抗訓練的神經網路架構,用來產生擬真的合成資料。
生成對抗網路(GAN)是 Ian Goodfellow 在 2014 年提出的神經網路架構,由兩個互相對抗的模型組成。**生成器(generator)** 負責產生假資料(例如圖片),**判別器(discriminator)** 則負責分辨資料是真的還是生成的。兩者在競爭中一起變強,直到生成器產出的內容已經和真實資料難以區分。
在擴散模型(diffusion model)崛起之前,GAN 是 AI 影像生成的核心技術。像 StyleGAN 產出的擬真人臉(thispersondoesnotexist.com)、deepfake、CycleGAN 的影像風格轉換、超解析度放大,背後都是 GAN。即使現在,它在醫學影像和需要快速單次生成的場景仍很常用。
最經典的比喻:生成器是偽造者,試著畫假畢卡索;判別器是鑑定師,負責抓出贗品。鑑定師越強,偽造者就被逼著畫得越好,反之亦然,最後偽造者的作品連鑑定師都只能用猜的。
GAN 的訓練出名地難搞 — 容易發生 mode collapse(生成器只會輸出幾種固定樣式)和梯度不穩。這也是 2022 年之後高階影像生成大多被擴散模型取代的原因之一。
延伸閱讀:diffusion model、VAE、StyleGAN、deepfake、mode collapse、Ian Goodfellow。