Mode Collapse(模式坍塌)

Mode collapse 是 Generative Adversarial Network, GAN 訓練時常見的失敗現象
生成器雖然能產生「看起來像真的」樣本,但多樣性不足,最後只會反覆生成少數幾種模式,無法覆蓋真實資料分布。


Summary


Key Points


1. 什麼是 mode collapse

Mode collapse 指的是
Generator 的輸出缺乏變化,很多不同的 latent vector 最後映射到很接近的結果。

可以把它理解成:

因此,模型看似有在生成資料,但其實只是在重複少量模式。

WGAN-Mode Collapse Introduction.png


2. 為什麼會發生

GAN 的訓練是 Generator 和 Discriminator 的對抗過程
若這個平衡失衡,就容易出現 mode collapse

常見原因:

簡單說,Generator 學到的是「怎麼騙過判別器」
不一定是「怎麼完整模仿真實分布」

WGAN-Mode Collapse.png


3. 怎麼判斷模型發生了 mode collapse

觀察指標通常不是只看 loss,而是看輸出的多樣性。

可以從幾個角度判斷:

Pasted image 20230411001010.png


4. 直觀例子

假設真實資料是手寫數字,資料裡同時有 0 到 9。

理想情況下:

若發生 mode collapse:


5. 常見緩解方向

常見做法是讓訓練更穩定,並提高對多樣性的約束。


Examples


Sources

Powered by Forestry.md