Unitless Unrestricted Markov-Consistent SCM Generation: Better Benchmark Datasets for Causal Discovery

要約

因果発見は、データから因果グラフの形で定性的因果知識を抽出することを目的としています。
因果基地の真理は現実の世界ではめったに知られていないため、シミュレートされたデータは、文献で提案されているさまざまな因果発見アルゴリズムのパフォーマンスを評価する上で重要な役割を果たします。
しかし、最近の研究では、変数の分散と他のすべての変数をそれぞれ回帰した後、変数の分散と測定係数(R2)を含む、非物理的である可能性のある構造因果モデル(SCM)の標準クラスの構造因果モデル(SCM)の一般的に使用されるデータ生成手法の特定のアーティファクトを強調しました。
いくつかの因果的方法は、そのようなアーティファクトを活用して、実際のデータでのパフォーマンスに対する非現実的な期待につながります。
これらのアーティファクトを削除するためにいくつかの変更が提案されています。
特に、内部的に標準化された構造因果モデル(ISCM)は、バーソルト性を回避し、まばらな因果グラフでR2溶解度を大幅に緩和しますが、作業では紹介されていないデンサーグラフの逆のR2溶解性パターンを示します。
実際のデータに表示されると予想されるソート性パターンを分析し、SCMの空間をより効果的にサンプリングする係数を描画する方法を提案します。
最後に、SCM生成法の新しい拡張を時系列設定に提案します。

要約(オリジナル)

Causal discovery aims to extract qualitative causal knowledge in the form of causal graphs from data. Because causal ground truth is rarely known in the real world, simulated data plays a vital role in evaluating the performance of the various causal discovery algorithms proposed in the literature. But recent work highlighted certain artifacts of commonly used data generation techniques for a standard class of structural causal models (SCM) that may be nonphysical, including var- and R2-sortability, where the variables’ variance and coefficients of determination (R2) after regressing on all other variables, respectively, increase along the causal order. Some causal methods exploit such artifacts, leading to unrealistic expectations for their performance on real-world data. Some modifications have been proposed to remove these artifacts; notably, the internally-standardized structural causal model (iSCM) avoids varsortability and largely alleviates R2-sortability on sparse causal graphs, but exhibits a reversed R2-sortability pattern for denser graphs not featured in their work. We analyze which sortability patterns we expect to see in real data, and propose a method for drawing coefficients that we argue more effectively samples the space of SCMs. Finally, we propose a novel extension of our SCM generation method to the time series setting.

arxiv情報

著者 Rebecca J. Herman,Jonas Wahl,Urmi Ninad,Jakob Runge
発行日 2025-05-15 15:22:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク