Combating Mode Collapse in GANs via Manifold Entropy Estimation

要約

タイトル:マニホールドエントロピー推定によるGANのモード抑制

要約:
– GAN(敵対的生成ネットワーク)は、最近の多様なタスクや応用で説得力のある結果を示しているが、モード抑制は依然として重大な問題である。
– 本論文では、GANのモード抑制問題に対処するための新しいトレーニングパイプラインを提案する。
– 既存の手法と異なり、我々はディスクリミネータを特徴埋め込みとして一般化し、ディスクリミネータによって学習された埋め込み空間内の分布のエントロピーを最大化することを提案する。
– 具体的には、Deep Local Linear Embedding(DLLE)とDeep Isometric feature Mapping(DIsoMap)という2つの正則化項を設計し、ディスクリミネータにデータに埋め込まれた構造情報を学習させ、ディスクリミネータによって学習された埋め込み空間が良く形成されるようにする。
– ディスクリミネータによってサポートされた良く学習された埋め込み空間に基づいて、非パラメトリックなエントロピー推定器を設計し、埋め込みベクトルのエントロピーを効率的に最大化することで、生成された分布のエントロピーを最大化することの近似を行う。
– ディスクリミネータを改良し、埋め込み空間内で最も類似したサンプルの距離を最大化することで、我々のパイプラインは生成されたサンプルの品質を犠牲にすることなく、効果的にモード抑制を減らすことができる。
– 広範な実験結果は、我々の手法の有効性を示しており、CelebAではGANベースラインであるMaF-GANを上回り(FIDで9.13 vs. 12.43)、ANIME-FACEデータセットでは最近の最先端のエネルギーベースのモデルを上回る(Inceptionスコアで2.80 vs. 2.26)。
– コードはhttps://github.com/HaozheLiu-ST/MEEで入手可能。

要約(オリジナル)

Generative Adversarial Networks (GANs) have shown compelling results in various tasks and applications in recent years. However, mode collapse remains a critical problem in GANs. In this paper, we propose a novel training pipeline to address the mode collapse issue of GANs. Different from existing methods, we propose to generalize the discriminator as feature embedding and maximize the entropy of distributions in the embedding space learned by the discriminator. Specifically, two regularization terms, i.e., Deep Local Linear Embedding (DLLE) and Deep Isometric feature Mapping (DIsoMap), are designed to encourage the discriminator to learn the structural information embedded in the data, such that the embedding space learned by the discriminator can be well-formed. Based on the well-learned embedding space supported by the discriminator, a non-parametric entropy estimator is designed to efficiently maximize the entropy of embedding vectors, playing as an approximation of maximizing the entropy of the generated distribution. By improving the discriminator and maximizing the distance of the most similar samples in the embedding space, our pipeline effectively reduces the mode collapse without sacrificing the quality of generated samples. Extensive experimental results show the effectiveness of our method, which outperforms the GAN baseline, MaF-GAN on CelebA (9.13 vs. 12.43 in FID) and surpasses the recent state-of-the-art energy-based model on the ANIME-FACE dataset (2.80 vs. 2.26 in Inception score). The code is available at https://github.com/HaozheLiu-ST/MEE

arxiv情報

著者 Haozhe Liu,Bing Li,Haoqian Wu,Hanbang Liang,Yawen Huang,Yuexiang Li,Bernard Ghanem,Yefeng Zheng
発行日 2023-04-08 11:03:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.CV パーマリンク