Monotone Generative Modeling via a Gromov-Monge Embedding


Generative Adversarial Networks (GAN) は、新しいコンテンツを作成するための強力なツールですが、開始条件やモードの崩壊に対する感度などの課題に直面しています。
これらの問題に対処するために、Gromov-Monge 埋め込み (GME) を利用する深層生成モデルを提案します。
我々は、GME による基礎となるジオメトリの保存と、生成マップの $c$ 循環単調性を保証します。ここで $c$ は、GME によって使用される固有の埋め込みコストです。


Generative Adversarial Networks (GANs) are powerful tools for creating new content, but they face challenges such as sensitivity to starting conditions and mode collapse. To address these issues, we propose a deep generative model that utilizes the Gromov-Monge embedding (GME). It helps identify the low-dimensional structure of the underlying measure of the data and then maps it, while preserving its geometry, into a measure in a low-dimensional latent space, which is then optimally transported to the reference measure. We guarantee the preservation of the underlying geometry by the GME and $c$-cyclical monotonicity of the generative map, where $c$ is an intrinsic embedding cost employed by the GME. The latter property is a first step in guaranteeing better robustness to initialization of parameters and mode collapse. Numerical experiments demonstrate the effectiveness of our approach in generating high-quality images, avoiding mode collapse, and exhibiting robustness to different starting conditions.


著者 Wonjun Lee,Yifei Yang,Dongmian Zou,Gilad Lerman
発行日 2023-11-02 16:33:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.LG, cs.NA, math.NA パーマリンク