Causal Discovery over High-Dimensional Structured Hypothesis Spaces with Causal Graph Partitioning

要約

多くの科学の目的は、一連の初期仮説から始めて、観察された変数の分布の基礎となるメカニズムを理解することです。
因果関係の発見により、必ずしも特定の領域に合わせることなく、メカニズムを原因と結果の関係のセットとして一般化された方法で推論することができます。
因果関係発見アルゴリズムは、一連の有向非循環グラフによって定義される構造化された仮説空間を検索して、データを最もよく説明するグラフを見つけます。
しかし、高次元の問題の場合、この探索は困難になるため、ギャップを埋めるには、因果関係を発見するためのスケーラブルなアルゴリズムが必要です。
この論文では、理論的な保証を備えた分割統治による因果発見を可能にする新しい因果グラフ パーティションを定義します。
私たちは、上部構造 (学習された仮説または既存の候補仮説のセット) のアイデアを活用して、探索空間を分割します。
特定の仮定の下で、因果グラフ分割を使用した学習により常に真の因果グラフのマルコフ同値クラスが得られることを証明します。
私たちのアルゴリズムが、生物学的に調整された合成ネットワークおよび最大 ${10^4}$ 変数までのネットワークに対して、同等の精度と解決までの時間を短縮することを示します。
これにより、私たちの方法は遺伝子制御ネットワーク推論や高次元構造化仮説空間を持つ他の領域に適用可能になります。

要約(オリジナル)

The aim in many sciences is to understand the mechanisms that underlie the observed distribution of variables, starting from a set of initial hypotheses. Causal discovery allows us to infer mechanisms as sets of cause and effect relationships in a generalized way — without necessarily tailoring to a specific domain. Causal discovery algorithms search over a structured hypothesis space, defined by the set of directed acyclic graphs, to find the graph that best explains the data. For high-dimensional problems, however, this search becomes intractable and scalable algorithms for causal discovery are needed to bridge the gap. In this paper, we define a novel causal graph partition that allows for divide-and-conquer causal discovery with theoretical guarantees. We leverage the idea of a superstructure — a set of learned or existing candidate hypotheses — to partition the search space. We prove under certain assumptions that learning with a causal graph partition always yields the Markov Equivalence Class of the true causal graph. We show our algorithm achieves comparable accuracy and a faster time to solution for biologically-tuned synthetic networks and networks up to ${10^4}$ variables. This makes our method applicable to gene regulatory network inference and other domains with high-dimensional structured hypothesis spaces.

arxiv情報

著者 Ashka Shah,Adela DePavia,Nathaniel Hudson,Ian Foster,Rick Stevens
発行日 2024-07-24 16:13:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.DC, cs.LG, stat.ME パーマリンク