GANs Conditioning Methods: A Survey

要約

近年、Generative Adversarial Networks (GAN)は大きな進歩を遂げ、様々な分野で広く採用されるに至っている。オリジナルのGANアーキテクチャは、コンテンツの特定の制御なしに画像を生成することが可能であり、無条件の生成プロセスとなっている。しかし、多くの実用的なアプリケーションでは、生成される出力に対する正確な制御が必要とされるため、生成プロセスを導くための明示的な条件付けを組み込んだ条件付きGAN(cGAN)の開発につながった。cGANは、追加の情報(条件)を組み込むことによって元のフレームワークを拡張し、特定の基準に準拠したサンプルの生成を可能にする。様々な条件付け手法が提案されており、それぞれ、条件付け情報をどのように生成ネットワークと識別ネットワークの両方に統合するかが異なっている。本研究では、GAN用に提案されている条件付け法をレビューし、各手法の特徴を探り、そのユニークなメカニズムと理論的基礎を明らかにする。さらに、これらの手法の比較分析を行い、様々な画像データセットにおける性能を評価する。これらの分析を通じて、様々な条件付け手法の長所と限界に関する洞察を提供し、生成モデリングにおける将来の研究と応用を導くことを目指す。

要約(オリジナル)

In recent years, Generative Adversarial Networks (GANs) have seen significant advancements, leading to their widespread adoption across various fields. The original GAN architecture enables the generation of images without any specific control over the content, making it an unconditional generation process. However, many practical applications require precise control over the generated output, which has led to the development of conditional GANs (cGANs) that incorporate explicit conditioning to guide the generation process. cGANs extend the original framework by incorporating additional information (conditions), enabling the generation of samples that adhere to that specific criteria. Various conditioning methods have been proposed, each differing in how they integrate the conditioning information into both the generator and the discriminator networks. In this work, we review the conditioning methods proposed for GANs, exploring the characteristics of each method and highlighting their unique mechanisms and theoretical foundations. Furthermore, we conduct a comparative analysis of these methods, evaluating their performance on various image datasets. Through these analyses, we aim to provide insights into the strengths and limitations of various conditioning techniques, guiding future research and application in generative modeling.

arxiv情報

著者 Anis Bourou,Valérie Mezger,Auguste Genovesio
発行日 2024-09-03 08:35:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.LG パーマリンク