A Two-Stage Feature Selection Approach for Robust Evaluation of Treatment Effects in High-Dimensional Observational Data


この課題を克服するために、この研究では、Outcome Adaptive Elastic Net (OAENet) と呼ばれる新しい 2 段階の特徴選択手法を提案します。この手法は、マッチング手法を使用して堅牢な因果推論の決定を行うために明示的に設計されています。
OAENet には、既存の手法に比べていくつかの重要な利点があります。それは、既存の手法と比較して相関データおよび高次元データに対するパフォーマンスが優れていること、および特定の変数セット (交絡因子や結果のみに関連する変数を含む) を選択できることです。
シミュレートされたデータの数値実験により、OAENet は、より高品質の推定値または同等の推定値を大幅に短時間で生成することにより、最先端の方法よりも大幅に優れたパフォーマンスを発揮することが実証されました。
OAENet の適用可能性を説明するために、大規模な米国の医療データを使用して、オピオイド使用障害 (OUD) が自殺行動に及ぼす影響を推定します。
競合する方法と比較した場合、OAENet は、OUD と自殺行動の関係に関する既存の文献と厳密に一致しています。
シミュレーション データと現実世界のデータの両方でのパフォーマンスは、OAENet が治療効果の推定や、因果関係推論による政策意思決定の評価の精度を著しく向上させていることを強調しています。


A Randomized Control Trial (RCT) is considered as the gold standard for evaluating the effect of any intervention or treatment. However, its feasibility is often hindered by ethical, economical, and legal considerations, making observational data a valuable alternative for drawing causal conclusions. Nevertheless, healthcare observational data presents a difficult challenge due to its high dimensionality, requiring careful consideration to ensure unbiased, reliable, and robust causal inferences. To overcome this challenge, in this study, we propose a novel two-stage feature selection technique called, Outcome Adaptive Elastic Net (OAENet), explicitly designed for making robust causal inference decisions using matching techniques. OAENet offers several key advantages over existing methods: superior performance on correlated and high-dimensional data compared to the existing methods and the ability to select specific sets of variables (including confounders and variables associated only with the outcome). This ensures robustness and facilitates an unbiased estimate of the causal effect. Numerical experiments on simulated data demonstrate that OAENet significantly outperforms state-of-the-art methods by either producing a higher-quality estimate or a comparable estimate in significantly less time. To illustrate the applicability of OAENet, we employ large-scale US healthcare data to estimate the effect of Opioid Use Disorder (OUD) on suicidal behavior. When compared to competing methods, OAENet closely aligns with existing literature on the relationship between OUD and suicidal behavior. Performance on both simulated and real-world data highlights that OAENet notably enhances the accuracy of estimating treatment effects or evaluating policy decision-making with causal inference.


著者 Md Saiful Islam,Sahil Shikalgar,Md. Noor-E-Alam
発行日 2024-03-12 17:25:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, stat.ME パーマリンク