From Two Sample Testing to Singular Gaussian Discrimination

要約

一般的な分離可能でコンパクトなメトリック空間での2つの確率測定値の平等のテストは、適切な繁殖するカーネルヒルベルト空間に関する2つの対応するガウス測定の間の特異点のテストと同等であることを確立します。
対応するガウスは、確率測定値のカーネル平均および共分散埋め込みの概念によって定義されます。
特に高次元の設定では、2つの特異なガウス人を識別することは、ノンパラメトリックの2サンプルテストよりも情報理論の観点から基本的に簡単です。
私たちの証明は、ヒルバート空間でのガウスの特異性/等価性のためのフェルドマン・ハジェク基準を活用し、分布間の矛盾が対応するガウスの埋め込みを通じて大きく拡大されていることを示しています。
これは、優れた一般性における効率的な推論ツールの設計のために利用できる次元の祝福の新しいインスタンスのようです。

要約(オリジナル)

We establish that testing for the equality of two probability measures on a general separable and compact metric space is equivalent to testing for the singularity between two corresponding Gaussian measures on a suitable Reproducing Kernel Hilbert Space. The corresponding Gaussians are defined via the notion of kernel mean and covariance embedding of a probability measure. Discerning two singular Gaussians is fundamentally simpler from an information-theoretic perspective than non-parametric two-sample testing, particularly in high-dimensional settings. Our proof leverages the Feldman-Hajek criterion for singularity/equivalence of Gaussians on Hilbert spaces, and shows that discrepancies between distributions are heavily magnified through their corresponding Gaussian embeddings: at a population level, distinct probability measures lead to essentially separated Gaussian embeddings. This appears to be a new instance of the blessing of dimensionality that can be harnessed for the design of efficient inference tools in great generality.

arxiv情報

著者 Leonardo V. Santoro,Kartik G. Waghmare,Victor M. Panaretos
発行日 2025-05-07 17:56:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 46E22, 60G15, 62G10, cs.LG, math.ST, stat.ML, stat.TH パーマリンク