Standardizing Structural Causal Models

要約

構造因果モデル(SCM)によって生成された合成データセットは、一般的に因果構造学習アルゴリズムのベンチマークに使用されます。
ただし、SCMデータの分散とペアワイズ相関は、因果順序に沿って増加する傾向があります。
いくつかの一般的なアルゴリズムはこれらのアーティファクトを活用しており、おそらく実際の設定に一般化されない結論につながる可能性があります。
$ \ operatorname {var} $ – 並べ替えや$ \ operatorname {r^2} $ – ソート性などの既存のメトリックは、これらのパターンを定量化しますが、それらを改善するためのツールを提供しません。
これに対処するために、生成プロセス中に各変数で標準化操作を導入するSCMの変更である内部標準化された構造因果モデル(ISCM)を提案します。
建設により、ISCMは$ \ operatorname {var} $ – 並べ替え可能ではありません。
また、それらがほとんど$ \ operatorname {r^2} $ではないという経験的証拠も見つかります – 一般的に使用されているグラフファミリに対してソート可能です。
さらに、標準SCMによって生成されたデータの事後標準化とは反対に、線形ISCMは重みに関する事前知識から識別できず、ここで研究されているベンチマーク問題を超えた因果関係の有用なモデルになる可能性がある大規模システムの決定論的な関係から崩壊しないことが証明されています。
私たちのコードは、https://github.com/werkaaa/iscmで公開されています。

要約(オリジナル)

Synthetic datasets generated by structural causal models (SCMs) are commonly used for benchmarking causal structure learning algorithms. However, the variances and pairwise correlations in SCM data tend to increase along the causal ordering. Several popular algorithms exploit these artifacts, possibly leading to conclusions that do not generalize to real-world settings. Existing metrics like $\operatorname{Var}$-sortability and $\operatorname{R^2}$-sortability quantify these patterns, but they do not provide tools to remedy them. To address this, we propose internally-standardized structural causal models (iSCMs), a modification of SCMs that introduces a standardization operation at each variable during the generative process. By construction, iSCMs are not $\operatorname{Var}$-sortable. We also find empirical evidence that they are mostly not $\operatorname{R^2}$-sortable for commonly-used graph families. Moreover, contrary to the post-hoc standardization of data generated by standard SCMs, we prove that linear iSCMs are less identifiable from prior knowledge on the weights and do not collapse to deterministic relationships in large systems, which may make iSCMs a useful model in causal inference beyond the benchmarking problem studied here. Our code is publicly available at: https://github.com/werkaaa/iscm.

arxiv情報

著者 Weronika Ormaniec,Scott Sussex,Lars Lorch,Bernhard Schölkopf,Andreas Krause
発行日 2025-03-17 14:26:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク