Constraint-based causal discovery with tiered background knowledge and latent variables in single or overlapping datasets

要約

この論文では、制約ベースの因果発見の中で階層化された背景知識を使用することを検討します。
私たちの焦点は、因果的な十分性を緩和する設定、つまり、複数のオーバーラップデータセットの場合のように、関連する情報をまったく測定できないか、共同ではないために発生する可能性のある潜在変数を許可することです。
最初に、「階層化されたFCI」(TFCI)アルゴリズムの特性に関する新しい洞察を提示します。
これに基づいて、階層化された背景知識、「階層型IOD」(TiOD)アルゴリズムを組み込んだIOD(重複するデータセットの統合)アルゴリズムの新しい拡張機能を導入します。
階層化された背景知識TFCIとTIODの完全な使用法の下で、TioDとTFCIの単純なバージョンは健全で完全であることを示します。
さらに、TioDアルゴリズムは、マルコフの等価クラスの明らかな制限を超えても、IODアルゴリズムよりもかなり効率的で有益であると予想されることが多いことを示します。
私たちは、この効率と情報性の利益の条件について正式な結果を提供します。
私たちの結果には、階層化された背景知識の正確な役割と有用性を示す一連の例が伴います。

要約(オリジナル)

In this paper we consider the use of tiered background knowledge within constraint based causal discovery. Our focus is on settings relaxing causal sufficiency, i.e. allowing for latent variables which may arise because relevant information could not be measured at all, or not jointly, as in the case of multiple overlapping datasets. We first present novel insights into the properties of the ‘tiered FCI’ (tFCI) algorithm. Building on this, we introduce a new extension of the IOD (integrating overlapping datasets) algorithm incorporating tiered background knowledge, the ‘tiered IOD’ (tIOD) algorithm. We show that under full usage of the tiered background knowledge tFCI and tIOD are sound, while simple versions of the tIOD and tFCI are sound and complete. We further show that the tIOD algorithm can often be expected to be considerably more efficient and informative than the IOD algorithm even beyond the obvious restriction of the Markov equivalence classes. We provide a formal result on the conditions for this gain in efficiency and informativeness. Our results are accompanied by a series of examples illustrating the exact role and usefulness of tiered background knowledge.

arxiv情報

著者 Christine W. Bang,Vanessa Didelez
発行日 2025-03-27 14:14:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, math.ST, stat.ML, stat.TH パーマリンク