要約
電子医療記録 (EHR) の学習は、正確な医療診断を容易にする機能により、新たな注目を集めています。
EHR にはエンティティ間の複雑な相互作用を指定する豊富な情報が含まれているため、グラフを使用して EHR をモデル化することが実際に効果的であることが示されています。
ただし、EHR は高度な異質性、希薄性、および複雑性を示しており、これらが EHR に適用されるほとんどのモデルのパフォーマンスを妨げます。
さらに、EHR をモデル化する既存のアプローチは、多くの場合、単一タスクの表現を学習することに焦点を当てており、EHR 分析問題のマルチタスクの性質を見落としており、その結果、さまざまなタスクにわたる一般化が制限されています。
これらの制限を考慮して、我々は、EHR モデリングのための新しいフレームワーク、すなわち MulT-EHR (マルチタスク EHR) を提案します。これは、異種グラフを活用して複雑な関係をマイニングし、EHR 内の異種性をモデル化します。
大量のノイズを軽減するために、因果推論フレームワークに基づいたノイズ除去モジュールを導入して、深刻な交絡効果を調整し、EHR データのノイズを削減します。
さらに、私たちのモデルは同時マルチタスク予測に単一グラフ ニューラル ネットワークを採用しているため、タスク間の知識を活用してトレーニング プロセスを正規化するマルチタスク学習モジュールを設計します。
MIMIC-III および MIMIC-IV データセットに関する広範な実証研究により、提案された方法が 4 つの一般的な EHR 分析タスク (薬剤の推奨、入院期間、死亡率、および入院期間の予測) において常に最先端の設計を上回ることが検証されています。
再入院。
徹底的なアブレーション研究により、主要なコンポーネントとハイパーパラメータの変動に対する本手法の堅牢性が実証されています。
要約(オリジナル)
Learning electronic health records (EHRs) has received emerging attention because of its capability to facilitate accurate medical diagnosis. Since the EHRs contain enriched information specifying complex interactions between entities, modeling EHRs with graphs is shown to be effective in practice. The EHRs, however, present a great degree of heterogeneity, sparsity, and complexity, which hamper the performance of most of the models applied to them. Moreover, existing approaches modeling EHRs often focus on learning the representations for a single task, overlooking the multi-task nature of EHR analysis problems and resulting in limited generalizability across different tasks. In view of these limitations, we propose a novel framework for EHR modeling, namely MulT-EHR (Multi-Task EHR), which leverages a heterogeneous graph to mine the complex relations and model the heterogeneity in the EHRs. To mitigate the large degree of noise, we introduce a denoising module based on the causal inference framework to adjust for severe confounding effects and reduce noise in the EHR data. Additionally, since our model adopts a single graph neural network for simultaneous multi-task prediction, we design a multi-task learning module to leverage the inter-task knowledge to regularize the training process. Extensive empirical studies on MIMIC-III and MIMIC-IV datasets validate that the proposed method consistently outperforms the state-of-the-art designs in four popular EHR analysis tasks — drug recommendation, and predictions of the length of stay, mortality, and readmission. Thorough ablation studies demonstrate the robustness of our method upon variations to key components and hyperparameters.
arxiv情報
著者 | Tsai Hor Chan,Guosheng Yin,Kyongtae Bae,Lequan Yu |
発行日 | 2024-08-14 14:06:13+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google