Stage-Aware Learning for Dynamic Treatments

要約

動的治療計画 (DTR) の最近の進歩により、個人の特定のニーズに合わせて調整され、期待される臨床上の利点を最大化できる最適な治療の探索が容易になりました。
しかし、逆確率重み付け推定器 (IPWE) などの一貫した軌道に依存する既存のアルゴリズムは、特に慢性疾患の状況において、最適な治療下でのサンプルサイズが不十分であったり、意思決定段階が増えたりするという問題に悩まされる可能性があります。
これらの課題に対処するために、我々は、観察された治療軌道と、意思決定段階全体にわたる最適なレジームによって得られた軌道との間の整合を優先することに焦点を当てて、DTRを推定する新しい個別学習方法を提案します。
観察された軌跡が最適な処理と完全に一致していなければならないという制限を緩和することにより、私たちのアプローチは、IPWE ベースのメソッドのサンプル効率と安定性を大幅に向上させます。
特に、提案された学習スキームは、私たちの特別なケースとして人気のある結果加重学習フレームワークを含む、より一般的なフレームワークを構築します。
さらに、決定段階間の異質性を明示的に説明するための注意メカニズムとともに段階重要度スコアの概念を導入します。
フィッシャーの一貫性や有限サンプルの性能限界など、提案されたアプローチの理論的特性を確立します。
経験的に、広範なシミュレート環境と新型コロナウイルス感染症パンデミックの実際のケーススタディで提案された方法を評価します。

要約(オリジナル)

Recent advances in dynamic treatment regimes (DTRs) facilitate the search for optimal treatments, which are tailored to individuals’ specific needs and able to maximize their expected clinical benefits. However, existing algorithms relying on consistent trajectories, such as inverse probability weighting estimators (IPWEs), could suffer from insufficient sample size under optimal treatments and a growing number of decision-making stages, particularly in the context of chronic diseases. To address these challenges, we propose a novel individualized learning method which estimates the DTR with a focus on prioritizing alignment between the observed treatment trajectory and the one obtained by the optimal regime across decision stages. By relaxing the restriction that the observed trajectory must be fully aligned with the optimal treatments, our approach substantially improves the sample efficiency and stability of IPWE-based methods. In particular, the proposed learning scheme builds a more general framework which includes the popular outcome weighted learning framework as a special case of ours. Moreover, we introduce the notion of stage importance scores along with an attention mechanism to explicitly account for heterogeneity among decision stages. We establish the theoretical properties of the proposed approach, including the Fisher consistency and finite-sample performance bound. Empirically, we evaluate the proposed method in extensive simulated environments and a real case study for the COVID-19 pandemic.

arxiv情報

著者 Hanwen Ye,Wenzhuo Zhou,Ruoqing Zhu,Annie Qu
発行日 2024-10-17 16:59:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク