Characteristic Guidance: Non-linear Correction for Diffusion Model at Large Guidance Scale

要約

ノイズ除去拡散確率モデル (DDPM) に関する一般的なガイダンスは、異なる条件付きモデルを線形に組み合わせて、サンプルの制御を強化します。
ただし、このアプローチでは、誘導規模が大きい場合に顕著になる非線形効果が見落とされます。
この問題に対処するために、分類子なしのガイド付き DDPM に第一原理の非線形補正を提供するサンプリング方法である特性ガイダンスを提案します。
このような補正により、ガイド付き DDPM は、トレーニングや導関数を必要とせず、既存のサンプリング方法と互換性のある方法で、基礎となる拡散プロセスのフォッカー・プランク方程式を尊重するように強制されます。
実験では、特性ガイダンスが制御を強化し、画像生成における色と露出の問題を軽減し、潜在空間のサンプリングから磁石の相転移などの物理問題の解決に至るまで、さまざまなアプリケーションで効果的であることが示されています。

要約(オリジナル)

Popular guidance for denoising diffusion probabilistic model (DDPM) linearly combines distinct conditional models together to provide enhanced control over samples. However, this approach overlooks nonlinear effects that become significant when guidance scale is large. To address this issue, we propose characteristic guidance, a sampling method that provides first-principle non-linear correction for classifier-free guided DDPMs. Such correction forces the guided DDPMs to respect the Fokker-Planck equation of their underlying diffusion process, in a way that is training-free, derivative-free, and compatible with existing sampling methods. Experiments show that characteristic guidance enhances control and reduces color and exposure issues in image generation, proving effective in diverse applications ranging from latent space sampling to solving physics problems like magnet phase transitions.

arxiv情報

著者 Candi Zheng,Yuan Lan
発行日 2024-01-16 04:36:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG, physics.data-an パーマリンク