要約
このペーパーでは、多変量独立性テストの最大距離相関と平均距離相関の利用を調査します。
わずかに依存する寸法の数に関して高次元設定でそれらの一貫性特性を特徴付け、各テスト統計の利点を比較し、それぞれのヌル分布を調べ、高速カイ二乗ベースのテスト手順を提示します。
結果のテストはノンパラメトリックであり、ユークリッド距離とガウスカーネルの両方に基礎となるメトリックとして適用されます。
提案されたテストの実際のユースケースをよりよく理解するために、最大距離相関、平均距離相関、およびさまざまな多変量依存シナリオにわたる元の距離相関の経験的パフォーマンスを評価し、ヒト血漿中のさまざまな癌タイプとペプチドレベルの存在をテストするための実際のデータ実験を実施します。
要約(オリジナル)
This paper investigates the utilization of maximum and average distance correlations for multivariate independence testing. We characterize their consistency properties in high-dimensional settings with respect to the number of marginally dependent dimensions, compare the advantages of each test statistic, examine their respective null distributions, and present a fast chi-square-based testing procedure. The resulting tests are non-parametric and applicable to both Euclidean distance and the Gaussian kernel as the underlying metric. To better understand the practical use cases of the proposed tests, we evaluate the empirical performance of the maximum distance correlation, average distance correlation, and the original distance correlation across various multivariate dependence scenarios, as well as conduct a real data experiment to test the presence of various cancer types and peptide levels in human plasma.
arxiv情報
著者 | Cencheng Shen,Yuexiao Dong |
発行日 | 2025-06-05 17:35:05+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google