DIET: Conditional independence testing with marginal dependence measures of residual information

要約

タイトル:残差情報の周辺依存測定による条件付き独立性のテスト(DIET)

要約:
– 条件付きランダム化テスト(CRT)は、観察された共変量zがある場合、変数xが変数yを予測するかどうかを評価する。CRTには、多数の予測モデルの適合が必要であり、これはしばしば計算上不可能である。
– CRTのコストを削減する既存の解決策は、データセットをトレインおよびテスト部分に分割するか、相互作用のためにヒューリスティックを依存することである。これらの解決策は、両方ともパワーの低下を引き起こす。
– DIETは、周辺独立統計を活用して、条件付き独立関係をテストするアルゴリズムを提案する。DIETは、2つのランダム変数の周辺独立性をテストする:F(x | z)とF(y | z)。ここで、 F(* | z)は条件付き累積分布関数(CDF)である。これらの変数は「情報残差」と呼ばれる。
– DIETが有限のサンプルタイプ1エラー制御を達成し、タイプ1エラー率を上回るパワーを実現するための十分な条件を与える。そして、情報残差間の相互情報量をテスト統計量として使用する場合、DIETが最も強力な条件下で有効なテストを提供することを証明する。最後に、DIETがいくつかの合成および実際のベンチマークで、他の扱いやすいCRTよりも高いパワーを実現することが示される。

要約(オリジナル)

Conditional randomization tests (CRTs) assess whether a variable $x$ is predictive of another variable $y$, having observed covariates $z$. CRTs require fitting a large number of predictive models, which is often computationally intractable. Existing solutions to reduce the cost of CRTs typically split the dataset into a train and test portion, or rely on heuristics for interactions, both of which lead to a loss in power. We propose the decoupled independence test (DIET), an algorithm that avoids both of these issues by leveraging marginal independence statistics to test conditional independence relationships. DIET tests the marginal independence of two random variables: $F(x \mid z)$ and $F(y \mid z)$ where $F(\cdot \mid z)$ is a conditional cumulative distribution function (CDF). These variables are termed ‘information residuals.’ We give sufficient conditions for DIET to achieve finite sample type-1 error control and power greater than the type-1 error rate. We then prove that when using the mutual information between the information residuals as a test statistic, DIET yields the most powerful conditionally valid test. Finally, we show DIET achieves higher power than other tractable CRTs on several synthetic and real benchmarks.

arxiv情報

著者 Mukund Sudarshan,Aahlad Manas Puli,Wesley Tansey,Rajesh Ranganath
発行日 2023-04-11 06:48:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.LG, stat.ME, stat.ML パーマリンク