Unsupervised Multiple Domain Translation through Controlled Disentanglement in Variational Autoencoder

要約

教師なし複数ドメイン変換は、システムをトレーニングするためのデータのペアを持たずに、あるドメインから別のドメインにデータを変換するタスクです。
通常、このタスクに対処するには、敵対的生成ネットワーク (GAN) に基づく手法が使用されます。
ただし、私たちの提案は、変分オートエンコーダーの修正バージョンのみに依存しています。
この変更は、設計により制御された方法で解きほぐされた 2 つの潜在変数の使用で構成されます。
この潜在変数の 1 つはドメインのみに依存するように課せられますが、もう 1 つはデータの残りの変動要因に依存する必要があります。
さらに、ドメイン潜在変数に条件を課すことにより、潜在空間の制御と理解が向上します。
私たちは、私たちのアプローチがさまざまな視覚データセットに作用し、他のよく知られた方法のパフォーマンスを向上させることを経験的に示しています。
最後に、実際に、潜在変数の 1 つはドメインに関連するすべての情報を格納し、もう 1 つはドメイン情報をほとんど含まないことを証明します。

要約(オリジナル)

Unsupervised Multiple Domain Translation is the task of transforming data from one domain to other domains without having paired data to train the systems. Typically, methods based on Generative Adversarial Networks (GANs) are used to address this task. However, our proposal exclusively relies on a modified version of a Variational Autoencoder. This modification consists of the use of two latent variables disentangled in a controlled way by design. One of this latent variables is imposed to depend exclusively on the domain, while the other one must depend on the rest of the variability factors of the data. Additionally, the conditions imposed over the domain latent variable allow for better control and understanding of the latent space. We empirically demonstrate that our approach works on different vision datasets improving the performance of other well known methods. Finally, we prove that, indeed, one of the latent variables stores all the information related to the domain and the other one hardly contains any domain information.

arxiv情報

著者 Antonio Almudévar,Théo Mariotte,Alfonso Ortega,Marie Tahon
発行日 2024-01-18 09:51:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク