要約
因果関係の広く使用されている「反事実的」定義は、一般化可能性ではなく、不偏性と正確性を目的として導き出されたものです。
介入効果の外部妥当性 (EV) の組み合わせ定義を提案します。
まず、効果観測の「背景」の概念を定義します。
次に、(観測されたおよび観測されていない) 背景のセットに基づいて、効果の一般化のための条件を定式化します。
これは、効果の一般化に対する 2 つの限界を明らかにします: (1) 数え切れないほどの背景すべての下で効果が観察される場合、または (2) バックグラウンドが十分にランダム化されている場合。
結果として得られた組み合わせフレームワークを使用して、元の反事実定式化におけるいくつかの問題、つまりサンプル外の妥当性、複数の効果の同時推定、バイアスと分散のトレードオフ、統計的検出力、現在の予測および説明手法との関連性を再検討します。
方法論的には、この定義により、反事実定義に続くパラメトリック推定問題を、非実験サンプルにおける組み合わせ列挙とランダム化問題によって置き換えることもできます。
このノンパラメトリック フレームワークを使用して、一般的な教師付き推定器、説明推定器、および因果効果推定器のパフォーマンスにおける (外部妥当性、非交絡性、および精度) のトレードオフを実証します。
また、このアプローチにより、非 i.i.d. で教師あり説明メソッドの使用がどのように可能になるかについても説明します。
サンプル。
新型コロナウイルス感染症のパンデミックは、いくつかの不完全なサンプルで予測を提供する学習ソリューションの必要性を浮き彫りにしました。
この差し迫った問題への応用例を示します。
要約(オリジナル)
The widely used ‘Counterfactual’ definition of Causal Effects was derived for unbiasedness and accuracy – and not generalizability. We propose a Combinatorial definition for the External Validity (EV) of intervention effects. We first define the concept of an effect observation ‘background’. We then formulate conditions for effect generalization based on their sets of (observed and unobserved) backgrounds. This reveals two limits for effect generalization: (1) when effects are observed under all their enumerable backgrounds, or, (2) when backgrounds have become sufficiently randomized. We use the resulting combinatorial framework to re-examine several issues in the original counterfactual formulation: out-of-sample validity, concurrent estimation of multiple effects, bias-variance tradeoffs, statistical power, and connections to current predictive and explaining techniques. Methodologically, the definitions also allow us to replace the parametric estimation problems that followed the counterfactual definition by combinatorial enumeration and randomization problems in non-experimental samples. We use this non-parametric framework to demonstrate (External Validity, Unconfoundness and Precision) tradeoffs in the performance of popular supervised, explaining, and causal-effect estimators. We also illustrate how the approach allows for the use of supervised and explaining methods in non-i.i.d. samples. The COVID19 pandemic highlighted the need for learning solutions to provide predictions in severally incomplete samples. We demonstrate applications in this pressing problem.
arxiv情報
著者 | Andre F. Ribeiro |
発行日 | 2024-05-14 17:50:27+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google