Learning Mixtures of Gaussians Using Diffusion Models

要約

準多項式 ($O(n^{\text{
最小重みの仮定の下での、poly log}\left(\frac{n+k}{\varepsilon}\right)})$) 時間とサンプルの複雑さ。
ほとんどが本質的に代数的である以前のアプローチとは異なり、私たちのアプローチは分析的であり、拡散モデルのフレームワークに依存しています。
拡散モデルは、生成モデリングの最新のパラダイムであり、通常、純粋なノイズ分布 (この場合はガウス分布) をデータ分布に変換するプロセスに沿ったスコア関数 (勾配 log-pdf) の学習に依存します。
画像生成などのタスクでは目覚ましいパフォーマンスを発揮しますが、自明ではない分布族を効率的に学習できるというエンドツーエンドの理論的保証はほとんどありません。
私たちはそのような最初の保証のいくつかを提供します。
次に、混合ガウスのスコア関数の高次ガウス ノイズ感度限界を導出し、区分多項式回帰 (多対数次数まで) を使用して帰納的に学習できることを示し、これを既知の拡散の収束結果と組み合わせます。
モデル。
私たちの結果は、混合分布が一定半径の $k$ ボールの結合でサポートされるガウスの連続混合にまで拡張されます。
特に、これは低次元多様体、またはより一般的にはカバー数が小さい集合上の分布のガウス畳み込みの場合に当てはまります。

要約(オリジナル)

We give a new algorithm for learning mixtures of $k$ Gaussians (with identity covariance in $\mathbb{R}^n$) to TV error $\varepsilon$, with quasi-polynomial ($O(n^{\text{poly log}\left(\frac{n+k}{\varepsilon}\right)})$) time and sample complexity, under a minimum weight assumption. Unlike previous approaches, most of which are algebraic in nature, our approach is analytic and relies on the framework of diffusion models. Diffusion models are a modern paradigm for generative modeling, which typically rely on learning the score function (gradient log-pdf) along a process transforming a pure noise distribution, in our case a Gaussian, to the data distribution. Despite their dazzling performance in tasks such as image generation, there are few end-to-end theoretical guarantees that they can efficiently learn nontrivial families of distributions; we give some of the first such guarantees. We proceed by deriving higher-order Gaussian noise sensitivity bounds for the score functions for a Gaussian mixture to show that that they can be inductively learned using piecewise polynomial regression (up to poly-logarithmic degree), and combine this with known convergence results for diffusion models. Our results extend to continuous mixtures of Gaussians where the mixing distribution is supported on a union of $k$ balls of constant radius. In particular, this applies to the case of Gaussian convolutions of distributions on low-dimensional manifolds, or more generally sets with small covering number.

arxiv情報

著者 Khashayar Gatmiry,Jonathan Kelner,Holden Lee
発行日 2024-04-29 17:00:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.DS, cs.LG, math.PR, math.ST, stat.ML, stat.TH パーマリンク