要約
拡散モデルは、新しいデータセットを生成するための事実上のフレームワークとなっています。
これらのモデルのコアは、時間内に拡散プロセスを逆転させる能力にあります。
この原稿の目標は、PDEの観点から、この方法がどのように機能するか、および逆ダイナミクスを管理するPDEを導き出す方法と、そのソリューションを分析的に研究する方法を説明することです。
前方と逆のダイナミクスをリンクすることにより、逆プロセスの分布が元の分布内に含まれるサポートがあることを示します。
したがって、拡散法は、分析的定式化において、本質的に元の分布を正規化するものではないため、一般化の原則はありません。
これは疑問を提起します:実際に発生することを考えると、一般化はどこで発生しますか?
さらに、フォワードプロセスの開始点が固定されているという仮定の下で、逆プロセスのSDEに対する明示的なソリューションを導き出します。
これにより、生成拡散モデルに2つの一般的なアプローチをリンクする新しい導出が提供されます:安定した拡散(離散ダイナミクス)とスコアベースのアプローチ(連続ダイナミクス)。
最後に、元の分布がデータポイントの有限セットで構成されている場合を調査します。
このシナリオでは、逆ダイナミクスが明示的であり(つまり、損失関数には明確なミニマイザーがあります)、ダイナミクスの解決には新しいサンプルの生成に失敗します。ダイナミクスは元のサンプルに収束します。
ある意味では、最小化の問題を正確に解決することは、「それ自身の利益にはあまりにも良い」(つまり、過剰な体制)です。
要約(オリジナル)
Diffusion models have become the de facto framework for generating new datasets. The core of these models lies in the ability to reverse a diffusion process in time. The goal of this manuscript is to explain, from a PDE perspective, how this method works and how to derive the PDE governing the reverse dynamics as well as to study its solution analytically. By linking forward and reverse dynamics, we show that the reverse process’s distribution has its support contained within the original distribution. Consequently, diffusion methods, in their analytical formulation, do not inherently regularize the original distribution, and thus, there is no generalization principle. This raises a question: where does generalization arise, given that in practice it does occur? Moreover, we derive an explicit solution to the reverse process’s SDE under the assumption that the starting point of the forward process is fixed. This provides a new derivation that links two popular approaches to generative diffusion models: stable diffusion (discrete dynamics) and the score-based approach (continuous dynamics). Finally, we explore the case where the original distribution consists of a finite set of data points. In this scenario, the reverse dynamics are explicit (i.e., the loss function has a clear minimizer), and solving the dynamics fails to generate new samples: the dynamics converge to the original samples. In a sense, solving the minimization problem exactly is ‘too good for its own good’ (i.e., an overfitting regime).
arxiv情報
著者 | Fei Cao,Kimball Johnston,Thomas Laurent,Justin Le,Sébastien Motsch |
発行日 | 2025-01-28 16:29:26+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google