Structured Generations: Using Hierarchical Clusters to guide Diffusion Models


このペーパーでは、階層的クラスタリングをノイズ除去拡散確率モデル (DDPM) のフレームワークに統合する深層生成モデルである Diffuse-TreeVAE を紹介します。
提案されたアプローチは、学習された潜在ツリー VAE ベースの構造のルート埋め込みからサンプリングすることによって新しい画像を生成し、階層パスを介して伝播し、第 2 段階の DDPM を利用してデータ クラスターごとに個別の高品質の画像を洗練および生成します。

その結果、画像の鮮明さが向上するだけでなく、生成されたサンプルがそれぞれのクラスターを代表するモデルが得られ、以前の VAE ベースの手法の制限に対処し、クラスタリング ベースの生成モデリングの状態を前進させることができます。


This paper introduces Diffuse-TreeVAE, a deep generative model that integrates hierarchical clustering into the framework of Denoising Diffusion Probabilistic Models (DDPMs). The proposed approach generates new images by sampling from a root embedding of a learned latent tree VAE-based structure, it then propagates through hierarchical paths, and utilizes a second-stage DDPM to refine and generate distinct, high-quality images for each data cluster. The result is a model that not only improves image clarity but also ensures that the generated samples are representative of their respective clusters, addressing the limitations of previous VAE-based methods and advancing the state of clustering-based generative modeling.


著者 Jorge da Silva Goncalves,Laura Manduchi,Moritz Vandenhirtz,Julia Vogt
発行日 2024-07-08 17:00:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CV, cs.LG パーマリンク