Soft Diffusion: Score Matching for General Corruptions

要約

以前に知られている拡散モデルを一般化する、より広範な腐敗プロセスのファミリーを定義します。
これらの一般的な拡散を逆転させるために、Soft Score Matching と呼ばれる新しい目的を提案します。これは、線形破損プロセスのスコア関数を証明可能に学習し、CelebA の最先端の結果をもたらします。
ソフト スコア マッチングは、劣化プロセスをネットワークに組み込み、破損後に拡散観察と一致するクリーンな画像を予測するようにモデルをトレーニングします。
私たちの目的が、腐敗プロセスのファミリーに適した規則性条件下で尤度の勾配を学習することを示します。
さらに、一般的な拡散プロセスの破損レベルを選択する原則的な方法と、Momentum Sampler と呼ばれる新しいサンプリング方法を開発します。
破損がガウスぼかしと低振幅加法性ノイズであるフレームワークを評価します。
私たちの方法は、CelebA-64 で最先端の FID スコア $1.85$ を達成し、以前のすべての線形拡散モデルよりも優れています。
また、バニラのノイズ除去拡散と比較して、計算上の大きな利点も示しています。

要約(オリジナル)

We define a broader family of corruption processes that generalizes previously known diffusion models. To reverse these general diffusions, we propose a new objective called Soft Score Matching that provably learns the score function for any linear corruption process and yields state of the art results for CelebA. Soft Score Matching incorporates the degradation process in the network and trains the model to predict a clean image that after corruption matches the diffused observation. We show that our objective learns the gradient of the likelihood under suitable regularity conditions for the family of corruption processes. We further develop a principled way to select the corruption levels for general diffusion processes and a novel sampling method that we call Momentum Sampler. We evaluate our framework with the corruption being Gaussian Blur and low magnitude additive noise. Our method achieves state-of-the-art FID score $1.85$ on CelebA-64, outperforming all previous linear diffusion models. We also show significant computational benefits compared to vanilla denoising diffusion.

arxiv情報

著者 Giannis Daras,Mauricio Delbracio,Hossein Talebi,Alexandros G. Dimakis,Peyman Milanfar
発行日 2022-09-12 17:45:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG パーマリンク