要約
この論文では、2 つの標準正規ランダム ベクトル $\mathsf{X}\in\mathbb{R}^{n}$ と $\mathsf{Y}\in\mathbb{R}^{
n}$ は相関があるかどうか。
これは仮説検定問題として定式化されます。帰無仮説では、これらのベクトルは統計的に独立していますが、代替仮説では、$\mathsf{X}$ と $\mathsf{Y}$ のランダムかつ一様に置換されたバージョンは次のようになります。
相関 $\rho$ と相関します。
最適なテストが情報理論的に不可能である閾値と可能な閾値を $n$ と $\rho$ の関数として分析します。
情報理論の下限を導出するために、直交多項式展開を使用して尤度比の 2 次モーメントを評価する新しい手法を開発しました。これにより、とりわけ、整数分割関数との驚くべき関係が明らかになります。
また、上記の設定の多次元一般化も研究します。ここでは、2 つのベクトルではなく 2 つのデータベース/行列を観察し、さらにこれら 2 つの間の部分相関を考慮します。
要約(オリジナル)
In this paper, we investigate the problem of deciding whether two standard normal random vectors $\mathsf{X}\in\mathbb{R}^{n}$ and $\mathsf{Y}\in\mathbb{R}^{n}$ are correlated or not. This is formulated as a hypothesis testing problem, where under the null hypothesis, these vectors are statistically independent, while under the alternative, $\mathsf{X}$ and a randomly and uniformly permuted version of $\mathsf{Y}$, are correlated with correlation $\rho$. We analyze the thresholds at which optimal testing is information-theoretically impossible and possible, as a function of $n$ and $\rho$. To derive our information-theoretic lower bounds, we develop a novel technique for evaluating the second moment of the likelihood ratio using an orthogonal polynomials expansion, which among other things, reveals a surprising connection to integer partition functions. We also study a multi-dimensional generalization of the above setting, where rather than two vectors we observe two databases/matrices, and furthermore allow for partial correlations between these two.
arxiv情報
著者 | Dor Elimelech,Wasim Huleihel |
発行日 | 2024-01-24 12:58:08+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google