要約
ガウス混合モデル(GMM)は、クラスタリング、分類、画像再構成、生成モデリングなどのタスクの機械学習で広く使用されています。
GMMSの操作における重要な課題は、計算効率的で幾何学的に意味のあるメトリックを定義することです。
混合物Wasserstein(MW)距離は、WassersteinメトリックをGMMSに適応し、ドメイン適応、データセット比較、補強学習など、さまざまなドメインに適用されています。
ただし、マトリックスの平方根推定と高価な線形プログラムを含む繰り返されるワッサースタイン距離計算から生じる高い計算コストは、高次元および大規模な問題に対するスケーラビリティを制限します。
これに対処するために、MW距離の複数の新規スライシングベースの近似を提案し、主要な最適な輸送特性を維持しながら計算の複雑さを大幅に削減します。
理論的観点から、導入されたメトリックの間にいくつかの弱い等価性を確立し、元のMW距離と十分に確立されたスライスされたワッサースタイン距離との関係を示します。
さらに、数値実験を通じてアプローチの有効性を検証し、クラスタリング、知覚画像比較、GMMの最小化における計算効率とアプリケーションを実証します
要約(オリジナル)
Gaussian mixture models (GMMs) are widely used in machine learning for tasks such as clustering, classification, image reconstruction, and generative modeling. A key challenge in working with GMMs is defining a computationally efficient and geometrically meaningful metric. The mixture Wasserstein (MW) distance adapts the Wasserstein metric to GMMs and has been applied in various domains, including domain adaptation, dataset comparison, and reinforcement learning. However, its high computational cost — arising from repeated Wasserstein distance computations involving matrix square root estimations and an expensive linear program — limits its scalability to high-dimensional and large-scale problems. To address this, we propose multiple novel slicing-based approximations to the MW distance that significantly reduce computational complexity while preserving key optimal transport properties. From a theoretical viewpoint, we establish several weak and strong equivalences between the introduced metrics, and show the relations to the original MW distance and the well-established sliced Wasserstein distance. Furthermore, we validate the effectiveness of our approach through numerical experiments, demonstrating computational efficiency and applications in clustering, perceptual image comparison, and GMM minimization
arxiv情報
著者 | Moritz Piening,Robert Beinert |
発行日 | 2025-04-11 13:57:09+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google