Improving GANs with a Feature Cycling Generator

要約

ジェネレーターとディスクリミネーターで構築された敵対的生成ネットワーク (GAN) は、高度な画像生成機能を備えています。
通常、既存の論文では、ジェネレーターのトレーニングが容易になるため、複数の残差ブロックを積み重ねてジェネレーターを構築します。
ただし、最近のいくつかの論文では、残りのブロックの制限についてコメントし、GAN のパフォーマンスを向上させる新しいアーキテクチャ ユニットを提案しています。
この傾向に従って、この論文では、画像生成タスクで印象的な結果を達成する機能サイクリング ブロック (FCB) と呼ばれる新しいユニットを紹介します。
具体的には、FCB には 2 つのブランチがあります。1 つはメモリ ブランチで、もう 1 つはイメージ ブランチです。
メモリ ブランチはジェネレータの各段階で意味のある情報を保持しますが、イメージ ブランチはメモリ ブランチからいくつかの有用な機能を取得して高品質のイメージを生成します。
提案された方法の機能を示すために、CIFAR-10、CIFAR-100、FFHQ、AFHQ、および LSUN のサブセットを含むさまざまなデータセットを使用して広範な実験を行いました。
実験結果は、目的関数やトレーニング スキルを犠牲にすることなく、ベースラインを超えるアプローチの実質的な優位性を示しています。
たとえば、提案された方法は、StyleGAN2 のフレシェ開始距離 (FID) を FFHQ データセットで 4.89 から 3.72 に、LSUN ベッド データセットで 6.64 から 5.57 に改善します。
この論文で提示された先駆的な試みは、より優れた設計の発電機アーキテクチャと、提案された方法と互換性のあるトレーニングの目的またはスキルでコミュニティを鼓舞することができると信じています.

要約(オリジナル)

Generative adversarial networks (GANs), built with a generator and discriminator, significantly have advanced image generation. Typically, existing papers build their generators by stacking up multiple residual blocks since it makes ease the training of generators. However, some recent papers commented on the limitation of the residual block and proposed a new architectural unit that improves the GANs performance. Following this trend, this paper presents a novel unit, called feature cycling block (FCB), which achieves impressive results in the image generation task. Specifically, the FCB has two branches: one is a memory branch and the other is an image branch. The memory branch keeps meaningful information at each stage of the generator, whereas the image branch takes some useful features from the memory branch to produce a high-quality image. To show the capability of the proposed method, we conducted extensive experiments using various datasets including CIFAR-10, CIFAR-100, FFHQ, AFHQ, and subsets of LSUN. Experimental results demonstrate the substantial superiority of our approach over the baseline without incurring any objective functions or training skills. For instance, the proposed method improves Frechet inception distance (FID) of StyleGAN2 from 4.89 to 3.72 on the FFHQ dataset and from 6.64 to 5.57 on the LSUN Bed dataset. We believe that the pioneering attempt presented in this paper could inspire the community with better-designed generator architecture and with training objectives or skills compatible with the proposed method.

arxiv情報

著者 Seung Park,Yong-Goo Shin
発行日 2023-02-17 15:05:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク