Controllable Data Generation Via Iterative Data-Property Mutual Mappings

要約

深層生成モデルは、画像、分子、テキスト、音声など、さまざまな分野で現実的なデータ サンプルを生成できるため、広く使用されています。
データ生成の主な目標の 1 つは制御性、つまり、望ましい特性を持つ新しいデータを生成することです。
制御可能な発電の分野への関心が高まっているにもかかわらず、1) 所望の特性と無関係な潜在変数の絡み合いを解くこと、2) 分配範囲外の特性制御、3) 分配範囲外の特性制御の客観的最適化など、重大な課題が依然として残されています。
これらの課題に対処するために、この論文では、VAE ベースのデータ ジェネレーターを特性の制御性で強化し、もつれを確実に解消するための一般的なフレームワークを提案します。
私たちが提案する目標は、トレーニング セット内に表示されるデータと表示されないデータの両方で最適化できます。
データとプロパティ間の相互マッピングを繰り返し実行することにより、半教師ありで目的をトレーニングするトレーニング手順を提案します。
提案されたフレームワークは 4 つの VAE ベースの制御可能なジェネレーターに実装され、プロパティ エラー、もつれの解除、生成品質、およびトレーニング時間に関するパフォーマンスを評価します。
この結果は、私たちが提案したフレームワークにより、短いトレーニング時間で生成されたサンプルの特性をより正確に制御でき、生成されたサンプルのもつれを確実に解きほぐし、有効性を維持できることを示しています。

要約(オリジナル)

Deep generative models have been widely used for their ability to generate realistic data samples in various areas, such as images, molecules, text, and speech. One major goal of data generation is controllability, namely to generate new data with desired properties. Despite growing interest in the area of controllable generation, significant challenges still remain, including 1) disentangling desired properties with unrelated latent variables, 2) out-of-distribution property control, and 3) objective optimization for out-of-distribution property control. To address these challenges, in this paper, we propose a general framework to enhance VAE-based data generators with property controllability and ensure disentanglement. Our proposed objective can be optimized on both data seen and unseen in the training set. We propose a training procedure to train the objective in a semi-supervised manner by iteratively conducting mutual mappings between the data and properties. The proposed framework is implemented on four VAE-based controllable generators to evaluate its performance on property error, disentanglement, generation quality, and training time. The results indicate that our proposed framework enables more precise control over the properties of generated samples in a short training time, ensuring the disentanglement and keeping the validity of the generated samples.

arxiv情報

著者 Bo Pan,Muran Qin,Shiyu Wang,Yifei Zhang,Liang Zhao
発行日 2023-10-11 17:34:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク