要約
制限されたモデルクラスで適合度を調べることにより、因果方向を推測するために、しばしば二変量構造因果モデル(SCM)が使用されます。
この論文では、原因変数を動的システムの時間と見なすことにより、因果速度の観点からの二変量SCMのパラメーター化について説明します。
速度は、観測が初期条件を指定する初期値の問題の解を介して反事実的な曲線を暗黙的に定義します。
メジャートランスポートからのツールを使用して、SCMSとその因果速度を介して生成された分布のスコア関数との間に一意の対応を取得します。
これに基づいて、スコア関数に対して速度を直接回帰する目的関数を導き出します。後者は、観測データから非パラメトリックに推定できます。
これを使用して、添加剤や位置スケールノイズなどの既知のモデルクラスを超えて拡張され、ノイズ分布に関する仮定を必要としない二変量因果発見の方法を開発します。
スコアが十分に推定される場合、目標はモデルの非識別性と誤解を検出するのにも役立ちます。
多くの既存の方法が失敗するシミュレーションとベンチマーク実験で肯定的な結果を提示し、アブレーション研究を実行して、正確なスコア推定に対する方法の感度を調べます。
要約(オリジナル)
Bivariate structural causal models (SCM) are often used to infer causal direction by examining their goodness-of-fit under restricted model classes. In this paper, we describe a parametrization of bivariate SCMs in terms of a causal velocity by viewing the cause variable as time in a dynamical system. The velocity implicitly defines counterfactual curves via the solution of initial value problems where the observation specifies the initial condition. Using tools from measure transport, we obtain a unique correspondence between SCMs and the score function of the generated distribution via its causal velocity. Based on this, we derive an objective function that directly regresses the velocity against the score function, the latter of which can be estimated non-parametrically from observational data. We use this to develop a method for bivariate causal discovery that extends beyond known model classes such as additive or location scale noise, and that requires no assumptions on the noise distributions. When the score is estimated well, the objective is also useful for detecting model non-identifiability and misspecification. We present positive results in simulation and benchmark experiments where many existing methods fail, and perform ablation studies to examine the method’s sensitivity to accurate score estimation.
arxiv情報
著者 | Johnny Xi,Hugh Dance,Peter Orbanz,Benjamin Bloem-Reddy |
発行日 | 2025-02-07 17:50:14+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google