Causal Q-Aggregation for CATE Model Selection


条件付き平均治療効果 (CATE) の正確な推定は、個別化された意思決定の中核です。
CATE 推定には多数のモデルがありますが、因果推論という基本的な問題があるため、モデルの選択は簡単な作業ではありません。
最近の実証研究では、二重の堅牢な特性を備えたプロキシ損失メトリクスとモデル アンサンブルを支持する証拠が提供されています。
以前の理論的研究を直接適用すると、モデル選択問題の非凸性により、最適ではないオラクル モデルの選択率が発生します。
我々は、主要な既存の CATE アンサンブル アプローチの後悔率を提供し、二重にロバストな損失を使用する Q アグリゲーションに基づく新しい CATE モデル アンサンブル アプローチを提案します。
私たちの主な結果は、因果的 Q 集計が $\frac{\log(M)}{n}$ ($M$ モデルと $n$ サンプルを使用) という統計的に最適なオラクル モデル選択の後悔率を達成し、さらに高い確率を追加することを示しています。
– 迷惑関数の誤差の積に関連する次数推定誤差項。
重要なことは、私たちの後悔率は、候補となる CATE モデルのいずれかが真実に近いことを必要としていないということです。
私たちは多くの半合成データセットで新しい方法を検証し、操作変数と観測されていない交絡を使用した CATE モデル選択への作業の拡張も提供します。


Accurate estimation of conditional average treatment effects (CATE) is at the core of personalized decision making. While there is a plethora of models for CATE estimation, model selection is a nontrivial task, due to the fundamental problem of causal inference. Recent empirical work provides evidence in favor of proxy loss metrics with double robust properties and in favor of model ensembling. However, theoretical understanding is lacking. Direct application of prior theoretical work leads to suboptimal oracle model selection rates due to the non-convexity of the model selection problem. We provide regret rates for the major existing CATE ensembling approaches and propose a new CATE model ensembling approach based on Q-aggregation using the doubly robust loss. Our main result shows that causal Q-aggregation achieves statistically optimal oracle model selection regret rates of $\frac{\log(M)}{n}$ (with $M$ models and $n$ samples), with the addition of higher-order estimation error terms related to products of errors in the nuisance functions. Crucially, our regret rate does not require that any of the candidate CATE models be close to the truth. We validate our new method on many semi-synthetic datasets and also provide extensions of our work to CATE model selection with instrumental variables and unobserved confounding.


著者 Hui Lan,Vasilis Syrgkanis
発行日 2023-10-31 17:32:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: 62D20(Secondary), 62F07(Primary), cs.LG, econ.EM, math.ST, stat.ML, stat.TH パーマリンク