要約
拡散モデルは、視覚的に印象的な画像の作成に優れていますが、指定されたトポロジーで画像を生成するのに苦労します。
画像内の構造の数を表すBetti数は、トポロジの基本的な尺度です。
しかし、拡散モデルは、この基本的な制約でさえ満たすことができません。
この制限により、ロボット工学や環境モデリングなど、正確な制御が必要なアプリケーションでのユーティリティが制限されます。
これに対処するために、拡散モデルを強制して望ましいトポロジを維持する新しいアプローチであるTopodiffusionNet(TDN)を提案します。
トポロジーデータ分析、特に永続的な相同性からツールを活用して、画像内のトポロジ構造を抽出します。
次に、トポロジベースの目的関数を設計して、ノイズの多い構造を抑制しながら、意図した構造を保存します。
4つのデータセットにわたる実験は、トポロジーの精度の大幅な改善を示しています。
TDNは、トポロジーを拡散モデルと統合した最初のものであり、この分野で新しい研究の道を開きます。
https://github.com/saumya-gupta-26/topodiffusionnetで入手可能なコード
要約(オリジナル)
Diffusion models excel at creating visually impressive images but often struggle to generate images with a specified topology. The Betti number, which represents the number of structures in an image, is a fundamental measure in topology. Yet, diffusion models fail to satisfy even this basic constraint. This limitation restricts their utility in applications requiring exact control, like robotics and environmental modeling. To address this, we propose TopoDiffusionNet (TDN), a novel approach that enforces diffusion models to maintain the desired topology. We leverage tools from topological data analysis, particularly persistent homology, to extract the topological structures within an image. We then design a topology-based objective function to guide the denoising process, preserving intended structures while suppressing noisy ones. Our experiments across four datasets demonstrate significant improvements in topological accuracy. TDN is the first to integrate topology with diffusion models, opening new avenues of research in this area. Code available at https://github.com/Saumya-Gupta-26/TopoDiffusionNet
arxiv情報
著者 | Saumya Gupta,Dimitris Samaras,Chao Chen |
発行日 | 2025-03-21 17:53:45+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google