Measuring Variable Importance in Heterogeneous Treatment Effects with Confidence

要約

因果機械学習(ML)は、複雑なデータから個々の治療効果を推定することを約束しています。
機械学習方法を使用した実世界のアプリケーションを成功させるためには、変数が治療への反応において不均一性を促進する信頼できる洞察を得ることが最も重要です。
条件付き平均治療効果(CATE)の推定における統計的に厳格なグローバル変数の重要性評価のために、条件付き順列の重要性(CPI)メソッドに基づくアルゴリズムであるPormucateを提案します。
有限サンプルレジームと経験的研究の理論的分析は、許可が休暇1-コバリエーションアウト(LOCO)参照法よりも低い分散があり、さまざまな重要性の信頼できる尺度を提供することを示しています。
この特性は統計力を高めます。これは、生物医学的応用に共通する限られたデータレジームにおける因果関係の推論に不可欠です。
最大数百の相関変数を持つ設定を含む、シミュレートされた現実世界の健康データセットで許可の利点を経験的に実証します。

要約(オリジナル)

Causal machine learning (ML) holds promise for estimating individual treatment effects from complex data. For successful real-world applications using machine learning methods, it is of paramount importance to obtain reliable insights into which variables drive heterogeneity in the response to treatment. We propose PermuCATE, an algorithm based on the Conditional Permutation Importance (CPI) method, for statistically rigorous global variable importance assessment in the estimation of the Conditional Average Treatment Effect (CATE). Theoretical analysis of the finite sample regime and empirical studies show that PermuCATE has lower variance than the Leave-One-Covariate-Out (LOCO) reference method and provides a reliable measure of variable importance. This property increases statistical power, which is crucial for causal inference in the limited-data regime common to biomedical applications. We empirically demonstrate the benefits of PermuCATE in simulated and real-world health datasets, including settings with up to hundreds of correlated variables.

arxiv情報

著者 Joseph Paillard,Angel Reyero Lobo,Vitaliy Kolodyazhniy,Bertrand Thirion,Denis A. Engemann
発行日 2025-02-07 17:35:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク