A Two-Stage Feature Selection Approach for Robust Evaluation of Treatment Effects in High-Dimensional Observational Data

要約

ランダム化対照試験(RCT)は、介入や治療の効果を評価するためのゴールドスタンダードとみなされます。
ただし、その実現可能性は倫理的、経済的、法的な考慮事項によって妨げられることが多く、観察データは因果関係の結論を導き出すための貴重な代替手段となります。
それにもかかわらず、医療観察データはその高次元性により困難な課題を抱えており、偏りのない信頼性の高い確実な因果推論を確保するには慎重な考慮が必要です。
この課題を克服するために、この研究では、Outcome Adaptive Elastic Net (OAENet) と呼ばれる新しい 2 段階の特徴選択手法を提案します。この手法は、マッチング手法を使用して堅牢な因果推論の決定を行うために明示的に設計されています。
OAENet には、既存の手法に比べていくつかの重要な利点があります。それは、既存の手法と比較して相関データおよび高次元データに対するパフォーマンスが優れていること、および特定の変数セット (交絡因子や結果のみに関連する変数を含む) を選択できることです。
これにより堅牢性が保証され、因果関係の不偏な推定が容易になります。
シミュレートされたデータの数値実験により、OAENet は、より高品質の推定値または同等の推定値を大幅に短時間で生成することにより、最先端の方法よりも大幅に優れたパフォーマンスを発揮することが実証されました。
OAENet の適用可能性を説明するために、大規模な米国の医療データを使用して、オピオイド使用障害 (OUD) が自殺行動に及ぼす影響を推定します。
競合する方法と比較した場合、OAENet は、OUD と自殺行動の関係に関する既存の文献と厳密に一致しています。
シミュレーション データと現実世界のデータの両方でのパフォーマンスは、OAENet が治療効果の推定や、因果関係推論による政策意思決定の評価の精度を著しく向上させていることを強調しています。

要約(オリジナル)

A Randomized Control Trial (RCT) is considered as the gold standard for evaluating the effect of any intervention or treatment. However, its feasibility is often hindered by ethical, economical, and legal considerations, making observational data a valuable alternative for drawing causal conclusions. Nevertheless, healthcare observational data presents a difficult challenge due to its high dimensionality, requiring careful consideration to ensure unbiased, reliable, and robust causal inferences. To overcome this challenge, in this study, we propose a novel two-stage feature selection technique called, Outcome Adaptive Elastic Net (OAENet), explicitly designed for making robust causal inference decisions using matching techniques. OAENet offers several key advantages over existing methods: superior performance on correlated and high-dimensional data compared to the existing methods and the ability to select specific sets of variables (including confounders and variables associated only with the outcome). This ensures robustness and facilitates an unbiased estimate of the causal effect. Numerical experiments on simulated data demonstrate that OAENet significantly outperforms state-of-the-art methods by either producing a higher-quality estimate or a comparable estimate in significantly less time. To illustrate the applicability of OAENet, we employ large-scale US healthcare data to estimate the effect of Opioid Use Disorder (OUD) on suicidal behavior. When compared to competing methods, OAENet closely aligns with existing literature on the relationship between OUD and suicidal behavior. Performance on both simulated and real-world data highlights that OAENet notably enhances the accuracy of estimating treatment effects or evaluating policy decision-making with causal inference.

arxiv情報

著者 Md Saiful Islam,Sahil Shikalgar,Md. Noor-E-Alam
発行日 2024-03-12 17:25:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, stat.ME パーマリンク