Hybrid Top-Down Global Causal Discovery with Local Search for Linear and Nonlinear Additive Noise Models

要約

未知の因果モデルに対応する固有の有向非巡回グラフを学習することは、困難な作業です。
関数因果モデルに基づく方法では、固有のグラフを識別できますが、次元の呪いに悩まされるか、強力なパラメトリック仮定を課すことになります。
これらの課題に対処するために、局所的な因果関係の下部構造を活用して、観測データから大域的な因果関係を発見するための新しいハイブリッド アプローチを提案します。
まず、線形構造方程式モデルの祖先関係を利用してコンパクトなトップダウンの階層的順序付けを確立し、既存の方法で生成される線形順序付けよりも多くの因果情報をエンコードするトポロジカルソートアルゴリズムを紹介します。
このアプローチが任意のノイズを含む非線形設定に一般化されることを示します。
次に、ローカル条件付けセットを検索することで偽のエッジを除去するノンパラメトリック制約ベースのアルゴリズムを導入し、現在の方法よりも高い精度を実現します。
合成データの経験的検証により、正確性と最悪の場合の多項式時間計算量の理論的保証を提供します。

要約(オリジナル)

Learning the unique directed acyclic graph corresponding to an unknown causal model is a challenging task. Methods based on functional causal models can identify a unique graph, but either suffer from the curse of dimensionality or impose strong parametric assumptions. To address these challenges, we propose a novel hybrid approach for global causal discovery in observational data that leverages local causal substructures. We first present a topological sorting algorithm that leverages ancestral relationships in linear structural equation models to establish a compact top-down hierarchical ordering, encoding more causal information than linear orderings produced by existing methods. We demonstrate that this approach generalizes to nonlinear settings with arbitrary noise. We then introduce a nonparametric constraint-based algorithm that prunes spurious edges by searching for local conditioning sets, achieving greater accuracy than current methods. We provide theoretical guarantees for correctness and worst-case polynomial time complexities, with empirical validation on synthetic data.

arxiv情報

著者 Sujai Hiremath,Jacqueline R. M. A. Maasch,Mengxiao Gao,Promit Ghosal,Kyra Gan
発行日 2024-09-18 14:43:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク