Characteristic Guidance: Non-linear Correction for Diffusion Model at Large Guidance Scale

要約

拡散確率モデル(DDPM:Diffusion Probabilistic Model)ノイズ除去のための一般的なガイダンスは、サンプルの制御を強化するために、異なる条件モデルを線形に結合する。しかし、このアプローチは、ガイダンスの規模が大きくなると顕著になる非線形効果を見落とす。この問題に対処するために、我々は、分類器を用いないガイダンスのための第一原理非線形補正を提供するガイダンス手法である特性ガイダンスを提案する。このような補正は、訓練不要で既存のサンプリング手法と互換性のある方法で、誘導されるDDPMに拡散過程のフォッカー・プランク(FP)方程式を尊重させる。実験によれば、特徴的なガイダンスは、プロンプトの意味的特徴を強化し、画像生成における不規則性を緩和することが示され、磁石の相転移のシミュレーションから潜在空間のサンプリングまで、様々な応用において有効であることが証明された。

要約(オリジナル)

Popular guidance for denoising diffusion probabilistic model (DDPM) linearly combines distinct conditional models together to provide enhanced control over samples. However, this approach overlooks nonlinear effects that become significant when guidance scale is large. To address this issue, we propose characteristic guidance, a guidance method that provides first-principle non-linear correction for classifier-free guidance. Such correction forces the guided DDPMs to respect the Fokker-Planck (FP) equation of diffusion process, in a way that is training-free and compatible with existing sampling methods. Experiments show that characteristic guidance enhances semantic characteristics of prompts and mitigate irregularities in image generation, proving effective in diverse applications ranging from simulating magnet phase transitions to latent space sampling.

arxiv情報

著者 Candi Zheng,Yuan Lan
発行日 2024-06-03 04:17:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.CV, cs.LG, physics.data-an パーマリンク