MaRS: A Fast Sampler for Mean Reverting Diffusion based on ODE and SDE Solvers

要約

拡散モデルの用途では、制御可能な生成は実際的に重要ですが、困難です。
制御可能な生成の現在の方法は、主に拡散モデルのスコア関数の変更に焦点を当てていますが、平均戻り(MR)拡散は確率微分方程式(SDE)の構造を直接修正し、画像条件の組み込みをより単純で自然なものにします。
ただし、現在のトレーニングなしの高速サンプラーは、MR拡散に直接適用できません。
したがって、MR拡散には、高品質のサンプルを取得するために何百ものNFE(関数評価の数)が必要です。
このホワイトペーパーでは、MR(MRサンプラー)という名前の新しいアルゴリズムを提案して、MR DiffusionのサンプリングNFEを削減します。
逆時間SDEとMR拡散に関連する確率流微分方程式(PF-ODE)を解き、半分析ソリューションを導き出します。
ソリューションは、分析機能とニューラルネットワークによってパラメーター化された積分で構成されています。
このソリューションに基づいて、より少ないステップで高品質のサンプルを生成できます。
私たちのアプローチでは、トレーニングを必要とせず、ノイズ予測、データ予測、速度予測など、すべての主流のパラメーター化をサポートします。
広範な実験は、サンプラー氏が10の異なる画像修復タスクで10〜20倍のスピードアップで高いサンプリング品質を維持していることを示しています。
私たちのアルゴリズムは、MR拡散のサンプリング手順を加速し、制御可能な生成でより実用的にします。

要約(オリジナル)

In applications of diffusion models, controllable generation is of practical significance, but is also challenging. Current methods for controllable generation primarily focus on modifying the score function of diffusion models, while Mean Reverting (MR) Diffusion directly modifies the structure of the stochastic differential equation (SDE), making the incorporation of image conditions simpler and more natural. However, current training-free fast samplers are not directly applicable to MR Diffusion. And thus MR Diffusion requires hundreds of NFEs (number of function evaluations) to obtain high-quality samples. In this paper, we propose a new algorithm named MaRS (MR Sampler) to reduce the sampling NFEs of MR Diffusion. We solve the reverse-time SDE and the probability flow ordinary differential equation (PF-ODE) associated with MR Diffusion, and derive semi-analytical solutions. The solutions consist of an analytical function and an integral parameterized by a neural network. Based on this solution, we can generate high-quality samples in fewer steps. Our approach does not require training and supports all mainstream parameterizations, including noise prediction, data prediction and velocity prediction. Extensive experiments demonstrate that MR Sampler maintains high sampling quality with a speedup of 10 to 20 times across ten different image restoration tasks. Our algorithm accelerates the sampling procedure of MR Diffusion, making it more practical in controllable generation.

arxiv情報

著者 Ao Li,Wei Fang,Hongbo Zhao,Le Lu,Ge Yang,Minfeng Xu
発行日 2025-03-24 15:18:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG パーマリンク