Fast ODE-based Sampling for Diffusion Models in Around 5 Steps

要約

拡散モデルからのサンプリングは、可能な限り少ない関数評価 (NFE) で正確な解を取得することを目的として、対応する常微分方程式 (ODE) を解くものとして扱うことができます。
最近、高次の ODE ソルバーを利用したさまざまな高速サンプラーが登場し、初期の一次ソルバーよりも優れたパフォーマンスを実現しています。
ただし、これらの数値的手法では本質的に特定の近似誤差が生じ、NFE が非常に小さい (たとえば、約 5) とサンプルの品質が大幅に低下します。
対照的に、各サンプリング軌跡は周囲空間に埋め込まれた 2 次元部分空間にほぼ存在するという幾何学的観察に基づいて、平均方向を直接学習することで打ち切り誤差を排除する近似平均方向ソルバー (AMED ソルバー) を提案します。
拡散サンプリング。
さらに、私たちの方法は、既存の ODE ベースのサンプラーをさらに改善するためのプラグインとして簡単に使用できます。
32 から 512 の範囲の解像度での画像合成に関する広範な実験により、私たちの方法の有効性が実証されました。
わずか 5 つの NFE で、CIFAR-10 では 6.61 FID、ImageNet 64$\times$64 では 10.74 FID、LSUN Bedroom では 13.20 FID を達成します。
私たちのコードは https://github.com/zju-pi/diff-sampler で入手できます。

要約(オリジナル)

Sampling from diffusion models can be treated as solving the corresponding ordinary differential equations (ODEs), with the aim of obtaining an accurate solution with as few number of function evaluations (NFE) as possible. Recently, various fast samplers utilizing higher-order ODE solvers have emerged and achieved better performance than the initial first-order one. However, these numerical methods inherently result in certain approximation errors, which significantly degrades sample quality with extremely small NFE (e.g., around 5). In contrast, based on the geometric observation that each sampling trajectory almost lies in a two-dimensional subspace embedded in the ambient space, we propose Approximate MEan-Direction Solver (AMED-Solver) that eliminates truncation errors by directly learning the mean direction for fast diffusion sampling. Besides, our method can be easily used as a plugin to further improve existing ODE-based samplers. Extensive experiments on image synthesis with the resolution ranging from 32 to 512 demonstrate the effectiveness of our method. With only 5 NFE, we achieve 6.61 FID on CIFAR-10, 10.74 FID on ImageNet 64$\times$64, and 13.20 FID on LSUN Bedroom. Our code is available at https://github.com/zju-pi/diff-sampler.

arxiv情報

著者 Zhenyu Zhou,Defang Chen,Can Wang,Chun Chen
発行日 2024-03-22 16:38:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク