Hybrid Meta-learners for Estimating Heterogeneous Treatment Effects

要約

観察データからの条件付き平均治療効果(CATE)の推定には、特にモデルの複雑さを正規化する方法に関して、監視された学習とは異なる決定をモデル化することが含まれます。
以前のアプローチは、明確な誘導バイアスを課す2つの主要な「メタライナー」パラダイムにグループ化できます。
間接的なメタ学習者は、最初に個別の潜在的な結果(PO)モデルを正規化および正規化し、その違いを取得してCATEを推定しますが、直接メタライナーはCATE機能自体の推定器を構築し、直接正規化します。
どちらのアプローチもすべてのシナリオで一貫して他のアプローチを上回ることはありません:間接的な学習者は、PO機能が単純な場合にうまく機能しますが、CATEが個々のPO機能よりもシンプルである場合、直接学習者はパフォーマンスを発揮します。
この論文では、手元のデータセットに応じて直接的な正規化と間接的な正則化を補間する新しい正規化戦略であるハイブリッド学習者(H-Learner)を紹介します。
Hラーナーは、POS自体の正確な個別近似を必ずしも必要とせずに、違いがCATEに密接に近似する中間関数を学習することにより、これを達成します。
POSに意図的に準最適な適合を許可することで、CATEの推定におけるバイアス分散トレードオフが改善されることを経験的に実証します。
半合成および実世界のベンチマークデータセットで実施された実験は、H-Learnerが一貫してパレートフロンティアで動作し、直接メタライナーと間接的なメタライナーの両方の強度を効果的に組み合わせることを示しています。

要約(オリジナル)

Estimating conditional average treatment effects (CATE) from observational data involves modeling decisions that differ from supervised learning, particularly concerning how to regularize model complexity. Previous approaches can be grouped into two primary ‘meta-learner’ paradigms that impose distinct inductive biases. Indirect meta-learners first fit and regularize separate potential outcome (PO) models and then estimate CATE by taking their difference, whereas direct meta-learners construct and directly regularize estimators for the CATE function itself. Neither approach consistently outperforms the other across all scenarios: indirect learners perform well when the PO functions are simple, while direct learners outperform when the CATE is simpler than individual PO functions. In this paper, we introduce the Hybrid Learner (H-learner), a novel regularization strategy that interpolates between the direct and indirect regularizations depending on the dataset at hand. The H-learner achieves this by learning intermediate functions whose difference closely approximates the CATE without necessarily requiring accurate individual approximations of the POs themselves. We demonstrate empirically that intentionally allowing suboptimal fits to the POs improves the bias-variance tradeoff in estimating CATE. Experiments conducted on semi-synthetic and real-world benchmark datasets illustrate that the H-learner consistently operates at the Pareto frontier, effectively combining the strengths of both direct and indirect meta-learners.

arxiv情報

著者 Zhongyuan Liang,Lars van der Laan,Ahmed Alaa
発行日 2025-06-16 16:37:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ME パーマリンク