Recovering Linear Causal Models with Latent Variables via Cholesky Factorization of Covariance Matrix

要約

観測データから有向非巡回グラフ (DAG) 構造を復元することで因果関係を発見することは、よく知られた難しい組み合わせ問題です。
潜在変数がある場合、問題はさらに難しくなります。
この論文では、最初に、観測データの共分散行列のコレスキー分解に基づく DAG 構造回復アルゴリズムを提案します。
このアルゴリズムは実装が速くて簡単で、正確な回復のための理論上の権限が与えられています。
合成データセットと現実世界のデータセットにおいて、このアルゴリズムは以前の方法よりも大幅に高速であり、最先端のパフォーマンスを実現します。
さらに、等誤差分散の仮定の下で、潜在変数による DAG 回復問題を処理するために、最適化手順をコレスキー分解ベースのアルゴリズムに組み込みます。
数値シミュレーションによると、修正された「コレスキー + 最適化」アルゴリズムは、ほとんどの場合、グラウンド トゥルース グラフを回復でき、既存のアルゴリズムよりも優れたパフォーマンスを発揮します。

要約(オリジナル)

Discovering the causal relationship via recovering the directed acyclic graph (DAG) structure from the observed data is a well-known challenging combinatorial problem. When there are latent variables, the problem becomes even more difficult. In this paper, we first propose a DAG structure recovering algorithm, which is based on the Cholesky factorization of the covariance matrix of the observed data. The algorithm is fast and easy to implement and has theoretical grantees for exact recovery. On synthetic and real-world datasets, the algorithm is significantly faster than previous methods and achieves the state-of-the-art performance. Furthermore, under the equal error variances assumption, we incorporate an optimization procedure into the Cholesky factorization based algorithm to handle the DAG recovering problem with latent variables. Numerical simulations show that the modified ‘Cholesky + optimization’ algorithm is able to recover the ground truth graph in most cases and outperforms existing algorithms.

arxiv情報

著者 Yunfeng Cai,Xu Li,Minging Sun,Ping Li
発行日 2023-11-01 17:27:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク