The Euclidean Space is Evil: Hyperbolic Attribute Editing for Few-shot Image Generation

要約

少数の画像だけで目に見えないカテゴリの多様な新しい画像を生成することを目的としているため、少数ショットの画像生成は困難な作業です。
既存の方法は、生成された画像の品質と多様性の間のトレードオフに悩まされています。
この問題に取り組むために、シンプルでありながら効果的な方法である双曲線属性編集 (HAE) を提案します。
ユークリッド空間で機能する他の方法とは異なり、HAE は、双曲空間で見られるカテゴリからのデータを使用して、画像間の階層をキャプチャします。
十分に訓練された HAE が与えられた場合、与えられた画像の潜在コードを固定半径でポアンカレ ディスク内の任意の意味のある方向に移動することにより、目に見えないカテゴリの画像を生成できます。
最も重要なことは、双曲空間により、ディスクに異なる半径を設定することで、生成された画像の意味の多様性を制御できることです。
広範な実験と視覚化により、HAE は限られたデータを使用して有望な品質と多様性を備えた画像を生成できるだけでなく、高度に制御可能で解釈可能な編集プロセスを実現できることが実証されています。

要約(オリジナル)

Few-shot image generation is a challenging task since it aims to generate diverse new images for an unseen category with only a few images. Existing methods suffer from the trade-off between the quality and diversity of generated images. To tackle this problem, we propose Hyperbolic Attribute Editing (HAE), a simple yet effective method. Unlike other methods that work in Euclidean space, HAE captures the hierarchy among images using data from seen categories in hyperbolic space. Given a well-trained HAE, images of unseen categories can be generated by moving the latent code of a given image toward any meaningful directions in the Poincar\’e disk with a fixing radius. Most importantly, the hyperbolic space allows us to control the semantic diversity of the generated images by setting different radii in the disk. Extensive experiments and visualizations demonstrate that HAE is capable of not only generating images with promising quality and diversity using limited data but achieving a highly controllable and interpretable editing process.

arxiv情報

著者 Lingxiao Li,Yi Zhang,Shuhui Wang
発行日 2022-11-22 15:35:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク