Deriving Causal Order from Single-Variable Interventions: Guarantees & Algorithm

要約

システムに対する的を絞った均一な介入は、因果関係を明らかにするために非常に重要です。
因果構造学習に介入データを活用する方法がいくつか開発されていますが、現実世界のシナリオでの実際の適用は依然として困難なことが多いです。
最近のベンチマーク研究では、多数の単一変数介入サンプルが利用可能な場合でも、こうした問題が浮き彫りになっています。
この研究では、そのようなデータセットには、データ分布に関する現実的な仮定の下で効果的に抽出できる豊富な因果情報が含まれていることを理論的および経験的に実証します。
より具体的には、観察設定と介入設定にわたる各変数の周辺分布間の比較に依存する介入忠実度の概念を導入し、因果的順序に関するスコアを導入します。
この仮定の下では、大規模な設定にも当てはまる最適なスコアに関する強力な理論的保証を証明することができます。
私たちの理論を経験的に検証するために、スコアを近似的に最適化することによって、多数の単一変数介入を含むデータセットから因果関係の順序を推測するように設計されたアルゴリズムである Intersort を導入します。
Intersort は、現場の一般的なベンチマークを再現するほぼすべてのシミュレートされたデータ設定で、ベースライン (GIES、PC、および EASE) を上回るパフォーマンスを示します。
したがって、介入データセットをモデル化するために私たちが提案した新しいアプローチは、因果推論を進めるための有望な手段を提供し、現実的な仮定の下でさらなる強化の大きな可能性を強調しています。

要約(オリジナル)

Targeted and uniform interventions to a system are crucial for unveiling causal relationships. While several methods have been developed to leverage interventional data for causal structure learning, their practical application in real-world scenarios often remains challenging. Recent benchmark studies have highlighted these difficulties, even when large numbers of single-variable intervention samples are available. In this work, we demonstrate, both theoretically and empirically, that such datasets contain a wealth of causal information that can be effectively extracted under realistic assumptions about the data distribution. More specifically, we introduce the notion of interventional faithfulness, which relies on comparisons between the marginal distributions of each variable across observational and interventional settings, and we introduce a score on causal orders. Under this assumption, we are able to prove strong theoretical guarantees on the optimum of our score that also hold for large-scale settings. To empirically verify our theory, we introduce Intersort, an algorithm designed to infer the causal order from datasets containing large numbers of single-variable interventions by approximately optimizing our score. Intersort outperforms baselines (GIES, PC and EASE) on almost all simulated data settings replicating common benchmarks in the field. Our proposed novel approach to modeling interventional datasets thus offers a promising avenue for advancing causal inference, highlighting significant potential for further enhancements under realistic assumptions.

arxiv情報

著者 Mathieu Chevalley,Patrick Schwab,Arash Mehrjou
発行日 2024-05-28 16:07:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク