Assumption violations in causal discovery and the robustness of score matching

要約

専門分野の知識が限られており、倫理的、経済的、時間的制約によって実験が制限されている場合、実践者は、データの統計的特性を利用して因果構造を回復するために観察的因果発見手法に頼ることになります。
更なる仮定を伴わない因果関係の発見は不適切な問題であるため、各アルゴリズムには通常はテストできない独自の一連の仮定が付属しており、その一部は実際のデータセットでは満たすのが困難です。
これらの考察に動機付けられて、この論文は、観察的i.i.d.に関する最近の因果関係発見手法の経験的パフォーマンスを広範囲にベンチマークします。
データはさまざまなバックグラウンド条件で生成されるため、選択した各アプローチで必要とされる重要な前提条件に違反する可能性があります。
私たちの実験結果は、スコア マッチング ベースの手法が、これらの困難なシナリオにおいて、推論されたグラフの偽陽性と偽陰性の割合において驚くべきパフォーマンスを示していることを示しており、そのパフォーマンスに関する理論的な洞察を提供します。
この研究は、ハイパーパラメータの値に関して因果発見アルゴリズムの安定性をベンチマークする最初の取り組みでもあります。
最後に、この論文が因果関係発見手法の評価に新たな標準を設定し、さまざまなアルゴリズムの選択による経験的な意味を強調しながら、この分野に興味を持つ実務家にとってアクセスしやすい入り口として機能することを願っています。

要約(オリジナル)

When domain knowledge is limited and experimentation is restricted by ethical, financial, or time constraints, practitioners turn to observational causal discovery methods to recover the causal structure, exploiting the statistical properties of their data. Because causal discovery without further assumptions is an ill-posed problem, each algorithm comes with its own set of usually untestable assumptions, some of which are hard to meet in real datasets. Motivated by these considerations, this paper extensively benchmarks the empirical performance of recent causal discovery methods on observational i.i.d. data generated under different background conditions, allowing for violations of the critical assumptions required by each selected approach. Our experimental findings show that score matching-based methods demonstrate surprising performance in the false positive and false negative rate of the inferred graph in these challenging scenarios, and we provide theoretical insights into their performance. This work is also the first effort to benchmark the stability of causal discovery algorithms with respect to the values of their hyperparameters. Finally, we hope this paper will set a new standard for the evaluation of causal discovery methods and can serve as an accessible entry point for practitioners interested in the field, highlighting the empirical implications of different algorithm choices.

arxiv情報

著者 Francesco Montagna,Atalanti A. Mastakouri,Elias Eulig,Nicoletta Noceti,Lorenzo Rosasco,Dominik Janzing,Bryon Aragam,Francesco Locatello
発行日 2024-09-26 17:55:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ME パーマリンク