Scalable Causal Discovery with Score Matching

要約

【タイトル】スコアマッチングによるスケーラブルな因果関係の発見
【要約】本論文では、非線形加法的ガウスノイズモデルにおいて、対数尤度の2階微分から全体の因果グラフを発見する方法を示しています。機械学習のスケーラブルな手法を利用して、スコア関数 $\nabla \log p(\mathbf{X})$ を近似し、Rollandら(2022年)の作業を拡張し、スコアからのトポロジカルオーダーのみを回復して、 スパージエッジを除去する費用のかかる剪定ステップが必要です。私たちの分析は、グラフサイズに比例する因果関係を剪定する複雑さを削減する実用的なアルゴリズムDAS(Discovery At Scale)につながります。実践的には、DASは現在の最先端と競合しながら1桁以上高速化されます。全体的に、私たちのアプローチは、原理上正当でスケーラブルな因果関係の発見を可能にし、計算処理のバーを大幅に下げます。

【要点】
– 非線形加法的ガウスノイズモデルにおいて、全体の因果グラフを発見する方法を示している
– スコア関数を近似することで、トポロジカルなオーダーだけを復元する方法よりも、グラフのサイズに比例する因果関係を剪定する方法を提案している
– この方法はDASと呼ばれ、現在の最先端と競合する1桁以上高速化されたアルゴリズムである
– スケーラブルな機械学習の手法を利用しているため、原理的にスケーラブルであり、計算処理のバーを大幅に下げることができる。

要約(オリジナル)

This paper demonstrates how to discover the whole causal graph from the second derivative of the log-likelihood in observational non-linear additive Gaussian noise models. Leveraging scalable machine learning approaches to approximate the score function $\nabla \log p(\mathbf{X})$, we extend the work of Rolland et al. (2022) that only recovers the topological order from the score and requires an expensive pruning step removing spurious edges among those admitted by the ordering. Our analysis leads to DAS (acronym for Discovery At Scale), a practical algorithm that reduces the complexity of the pruning by a factor proportional to the graph size. In practice, DAS achieves competitive accuracy with current state-of-the-art while being over an order of magnitude faster. Overall, our approach enables principled and scalable causal discovery, significantly lowering the compute bar.

arxiv情報

著者 Francesco Montagna,Nicoletta Noceti,Lorenzo Rosasco,Kun Zhang,Francesco Locatello
発行日 2023-04-06 21:28:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.LG, stat.ML パーマリンク