SwipeGANSpace: Swipe-to-Compare Image Generation via Efficient Latent Space Exploration

要約

敵対的生成ネットワーク (GAN) を使用して優先画像を生成することは、潜在空間の高次元の性質により困難です。
この研究では、単純なユーザーのスワイプ操作を使用してユーザーの好みの画像を生成する新しいアプローチを提案します。
スワイプ操作のみで潜在空間を効果的に探索するために、StyleGAN の潜在空間に主成分分析を適用し、意味のある部分空間を作成します。
マルチアームバンディットアルゴリズムを使用して、ユーザーの好みに焦点を当てて、探索する次元を決定します。
実験によれば、私たちの方法はベースライン方法よりも好ましい画像を生成するのに効率的であることが示されています。
さらに、画像生成中に好みの画像が変化したり、まったく異なる画像スタイルを表示したりすると、新たなインスピレーションが得られ、その後ユーザーの好みが変化することが観察されました。
これは、ユーザーの好みの動的な性質を強調しており、私たちが提案するアプローチはそれを認識し、強化します。

要約(オリジナル)

Generating preferred images using generative adversarial networks (GANs) is challenging owing to the high-dimensional nature of latent space. In this study, we propose a novel approach that uses simple user-swipe interactions to generate preferred images for users. To effectively explore the latent space with only swipe interactions, we apply principal component analysis to the latent space of the StyleGAN, creating meaningful subspaces. We use a multi-armed bandit algorithm to decide the dimensions to explore, focusing on the preferences of the user. Experiments show that our method is more efficient in generating preferred images than the baseline methods. Furthermore, changes in preferred images during image generation or the display of entirely different image styles were observed to provide new inspirations, subsequently altering user preferences. This highlights the dynamic nature of user preferences, which our proposed approach recognizes and enhances.

arxiv情報

著者 Yuto Nakashima,Mingzhe Yang,Yukino Baba
発行日 2024-04-30 16:37:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.HC パーマリンク