GLeaD: Improving GANs with A Generator-Leading Task

要約

Generative adversarial network (GAN) は、ジェネレーター (G) とディスクリミネーター (D) の間の 2 人用ゲームとして定式化されます。D は、画像が実際のデータから得られたものか、G によって生成されたものかを区別するよう求められます。
、D はルールメーカーとしてプレーするため、競争を支配する傾向があります。
GAN でのより公平なゲームに向けて、敵対的トレーニングの新しいパラダイムを提案します。これにより、G は D にもタスクを割り当てることができます。
具体的には、画像が与えられた場合、D が G によって適切にデコードされて入力を再構築できる代表的な特徴を抽出することを期待します。
そうすれば、D は自由に学習するのではなく、ドメイン分類について G の見解に合わせるよう促されます。
さまざまなデータセットに関する実験結果は、ベースラインに対するアプローチの実質的な優位性を示しています。
たとえば、LSUN ベッドルームでは StyleGAN2 の FID を 4.30 から 2.55 に、LSUN チャーチでは 4.04 から 2.82 に改善しました。
この作業に存在する先駆的な試みは、GAN 改善のためのより優れた設計のジェネレーター主導のタスクでコミュニティを鼓舞することができると信じています。

要約(オリジナル)

Generative adversarial network (GAN) is formulated as a two-player game between a generator (G) and a discriminator (D), where D is asked to differentiate whether an image comes from real data or is produced by G. Under such a formulation, D plays as the rule maker and hence tends to dominate the competition. Towards a fairer game in GANs, we propose a new paradigm for adversarial training, which makes G assign a task to D as well. Specifically, given an image, we expect D to extract representative features that can be adequately decoded by G to reconstruct the input. That way, instead of learning freely, D is urged to align with the view of G for domain classification. Experimental results on various datasets demonstrate the substantial superiority of our approach over the baselines. For instance, we improve the FID of StyleGAN2 from 4.30 to 2.55 on LSUN Bedroom and from 4.04 to 2.82 on LSUN Church. We believe that the pioneering attempt present in this work could inspire the community with better designed generator-leading tasks for GAN improvement.

arxiv情報

著者 Qingyan Bai,Ceyuan Yang,Yinghao Xu,Xihui Liu,Yujiu Yang,Yujun Shen
発行日 2022-12-07 16:25:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV パーマリンク