Two-sample Test using Projected Wasserstein Distance


私たちは、統計と機械学習の基本的な問題である 2 サンプル テストの投影ワッサースタイン距離を開発します。つまり、2 セットのサンプルが与えられ、それらが同じ分布からのものであるかどうかを判断します。
我々は、IPM における有限サンプル収束率の理論的特性を特徴付け、このメトリクスを計算するための実用的なアルゴリズムを提示します。


We develop a projected Wasserstein distance for the two-sample test, a fundamental problem in statistics and machine learning: given two sets of samples, to determine whether they are from the same distribution. In particular, we aim to circumvent the curse of dimensionality in Wasserstein distance: when the dimension is high, it has diminishing testing power, which is inherently due to the slow concentration property of Wasserstein metrics in the high dimension space. A key contribution is to couple optimal projection to find the low dimensional linear mapping to maximize the Wasserstein distance between projected probability distributions. We characterize the theoretical property of the finite-sample convergence rate on IPMs and present practical algorithms for computing this metric. Numerical examples validate our theoretical results.


著者 Jie Wang,Rui Gao,Yao Xie
発行日 2024-03-29 14:40:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.LG, stat.ML パーマリンク