Monotone Generative Modeling via a Gromov-Monge Embedding

要約

Generative Adversarial Networks (GAN) は、新しいコンテンツを作成するための強力なツールですが、開始条件やモードの崩壊に対する感度などの課題に直面しています。
これらの問題に対処するために、Gromov-Monge 埋め込み (GME) を利用する深層生成モデルを提案します。
これは、データの基礎となるメジャーの低次元構造を識別し、そのジオメトリを維持しながらそれを低次元の潜在空間内のメジャーにマッピングし、参照メジャーに最適に転送するのに役立ちます。
我々は、GME による基礎となるジオメトリの保存と、生成マップの $c$ 循環単調性を保証します。ここで $c$ は、GME によって使用される固有の埋め込みコストです。
後者のプロパティは、パラメーターの初期化とモード崩壊に対する堅牢性の向上を保証するための最初のステップです。
数値実験により、高品質の画像を生成し、モード崩壊を回避し、さまざまな開始条件に対する堅牢性を示す際のアプローチの有効性が実証されています。

要約(オリジナル)

Generative Adversarial Networks (GANs) are powerful tools for creating new content, but they face challenges such as sensitivity to starting conditions and mode collapse. To address these issues, we propose a deep generative model that utilizes the Gromov-Monge embedding (GME). It helps identify the low-dimensional structure of the underlying measure of the data and then maps it, while preserving its geometry, into a measure in a low-dimensional latent space, which is then optimally transported to the reference measure. We guarantee the preservation of the underlying geometry by the GME and $c$-cyclical monotonicity of the generative map, where $c$ is an intrinsic embedding cost employed by the GME. The latter property is a first step in guaranteeing better robustness to initialization of parameters and mode collapse. Numerical experiments demonstrate the effectiveness of our approach in generating high-quality images, avoiding mode collapse, and exhibiting robustness to different starting conditions.

arxiv情報

著者 Wonjun Lee,Yifei Yang,Dongmian Zou,Gilad Lerman
発行日 2023-11-02 16:33:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.NA, math.NA パーマリンク