要約
拡散ベースの生成モデルは最近有望な結果を達成しましたが、概念の理解、理論的分析、アルゴリズムの改善、および離散的で構造化された非ユークリッド ドメインへの拡張に関して、未解決の問題が数多く提起されています。
この作業は、より良い理論的理解を得て、任意のドメインからのデータのアルゴリズム拡張を開発するために、全体的なフレームワークを再検討しようとします。
拡散モデルを観測されていない拡散軌跡を持つ潜在変数モデルと見なし、補助分布から帰属された潜在軌跡を使用して最尤推定 (MLE) を適用することにより、モデルの構築と潜在軌跡の帰属の両方が、達成する拡散ブリッジプロセスの構築に相当することを示します。
エンドポイントでの決定論的な値と制約。そのために、体系的な研究と一連のツールを提供します。
私たちのフレームワークを活用して、1) 拡散生成モデルを学習するための最初の理論的エラー分析、および 2) さまざまな離散ドメインおよび制約ドメインからのデータを学習するためのシンプルで統一されたアプローチを提示します。
実験では、画像、セマンティック セグメント、および 3D ポイント クラウドの生成において、当社の方法が優れたパフォーマンスを発揮することが示されています。
要約(オリジナル)
Diffusion-based generative models have achieved promising results recently, but raise an array of open questions in terms of conceptual understanding, theoretical analysis, algorithm improvement and extensions to discrete, structured, non-Euclidean domains. This work tries to re-exam the overall framework, in order to gain better theoretical understandings and develop algorithmic extensions for data from arbitrary domains. By viewing diffusion models as latent variable models with unobserved diffusion trajectories and applying maximum likelihood estimation (MLE) with latent trajectories imputed from an auxiliary distribution, we show that both the model construction and the imputation of latent trajectories amount to constructing diffusion bridge processes that achieve deterministic values and constraints at end point, for which we provide a systematic study and a suit of tools. Leveraging our framework, we present 1) a first theoretical error analysis for learning diffusion generation models, and 2) a simple and unified approach to learning on data from different discrete and constrained domains. Experiments show that our methods perform superbly on generating images, semantic segments and 3D point clouds.
arxiv情報
著者 | Xingchao Liu,Lemeng Wu,Mao Ye,Qiang Liu |
発行日 | 2022-08-31 08:58:10+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google