Score matching through the roof: linear, nonlinear, and latent variables causal discovery

要約

観察データからの因果関係の発見には大きな期待が寄せられていますが、既存の方法は根底にある因果構造に関する強い仮定に依存しており、多くの場合、関連するすべての変数の完全な観察可能性が必要です。
私たちは、因果関係発見のために観測変数のスコア関数 $\nabla \log p(X)$ を活用することでこれらの課題に取り組み、以下の貢献を提案します。
まず、スコアによる識別可能性の既存の結果を、因果メカニズムに関する最小限の要件を持つ加法性ノイズ モデルに一般化します。
第二に、隠れた変数が存在する場合でもスコアから因果関係を推測するための条件を確立します。
この結果には 2 つの側面があります。隠れた変数を含む因果グラフの同値クラスを推論するための条件付き独立性テストの代替としてスコアの可能性を実証し、潜在変数モデルの直接原因を特定するために必要な条件を提供します。
これらの洞察に基づいて、線形、非線形、潜在変数モデルにわたる因果関係を発見するための柔軟なアルゴリズムを提案し、それを経験的に検証します。

要約(オリジナル)

Causal discovery from observational data holds great promise, but existing methods rely on strong assumptions about the underlying causal structure, often requiring full observability of all relevant variables. We tackle these challenges by leveraging the score function $\nabla \log p(X)$ of observed variables for causal discovery and propose the following contributions. First, we generalize the existing results of identifiability with the score to additive noise models with minimal requirements on the causal mechanisms. Second, we establish conditions for inferring causal relations from the score even in the presence of hidden variables; this result is two-faced: we demonstrate the score’s potential as an alternative to conditional independence tests to infer the equivalence class of causal graphs with hidden variables, and we provide the necessary conditions for identifying direct causes in latent variable models. Building on these insights, we propose a flexible algorithm for causal discovery across linear, nonlinear, and latent variable models, which we empirically validate.

arxiv情報

著者 Francesco Montagna,Philipp M. Faller,Patrick Bloebaum,Elke Kirschbaum,Francesco Locatello
発行日 2024-07-26 14:09:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, stat.ME, stat.ML パーマリンク