Causal machine learning for heterogeneous treatment effects in the presence of missing outcome data


この研究では、この一般的に見落とされがちな問題について議論し、欠落したランダム (MAR) 結果データが条件付き平均治療効果 (CATE) の因果的機械学習推定量に与える影響を検討します。
次に、CATE 用の 2 つの偏りのない機械学習推定器、mDR 学習者と mEP 学習者を提案します。これらは、打ち切り重みの逆確率を DR 学習者と EP 学習者にそれぞれ統合することで過小表現の問題に対処します。
合理的な条件下では、これらの推定量がオラクル的に効率的であることを示し、一般的な欠損データ技術を使用する推定量との比較を含む既存の CATE 推定量と比較して、シミュレートされたデータ設定を通じてその好ましいパフォーマンスを示します。
これらの推定値の実装に関するガイダンスが提供され、ACTG175 試験を使用したその適用例を示し、HIV-1 感染者におけるジドブジン単剤療法と代替抗レトロウイルス療法を比較する際の治療効果の不均一性を調査します。


When estimating heterogeneous treatment effects, missing outcome data can complicate treatment effect estimation, causing certain subgroups of the population to be poorly represented. In this work, we discuss this commonly overlooked problem and consider the impact that missing at random (MAR) outcome data has on causal machine learning estimators for the conditional average treatment effect (CATE). We then propose two de-biased machine learning estimators for the CATE, the mDR-learner and mEP-learner, which address the issue of under-representation by integrating inverse probability of censoring weights into the DR-learner and EP-learner respectively. We show that under reasonable conditions, these estimators are oracle efficient, and illustrate their favorable performance through simulated data settings, comparing them to existing CATE estimators, including comparison to estimators which use common missing data techniques. Guidance on the implementation of these estimators is provided and we present an example of their application using the ACTG175 trial, exploring treatment effect heterogeneity when comparing Zidovudine mono-therapy against alternative antiretroviral therapies among HIV-1-infected individuals.


著者 Matthew Pryce,Karla Diaz-Ordaz,Ruth H. Keogh,Stijn Vansteelandt
発行日 2024-12-27 16:10:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.LG, stat.ML パーマリンク