PRISM: Leveraging Prototype Patient Representations with Feature-Missing-Aware Calibration for EHR Data Sparsity Mitigation

要約

電子医療記録 (EHR) データは情報が豊富ではあるものの、多くの場合、情報が希薄であるため、予測モデリングにおいて重大な課題が生じています。
従来の代入手法では、実際のデータと代入データの区別が不十分であり、モデルに不正確性が生じる可能性があります。
これに対処するために、類似した患者のプロトタイプ表現を通じて間接的にデータを代入する新しいアプローチである PRISM を導入し、より高密度で正確な埋め込みを保証します。
PRISM は、欠損データを考慮して各特徴の信頼性を評価する特徴信頼学習モジュールによってさらに革新されています。
さらに、特徴の信頼性を考慮した新しい患者類似性メトリックが組み込まれており、不正確な帰属値への過度の依存を回避します。
MIMIC-III および MIMIC-IV データセットに関する広範な実験により、院内死亡率と 30 日間の再入院タスクの予測における PRISM の優れたパフォーマンスが実証され、EHR データの希薄性の処理における PRISM の有効性が示されました。
再現性とさらなる研究のために、コードを https://github.com/yhzhu99/PRISM で公開しました。

要約(オリジナル)

Electronic Health Record (EHR) data, while rich in information, often suffers from sparsity, posing significant challenges in predictive modeling. Traditional imputation methods inadequately distinguish between real and imputed data, leading to potential inaccuracies in models. Addressing this, we introduce PRISM, a novel approach that indirectly imputes data through prototype representations of similar patients, thus ensuring denser and more accurate embeddings. PRISM innovates further with a feature confidence learner module, which evaluates the reliability of each feature in light of missing data. Additionally, it incorporates a novel patient similarity metric that accounts for feature confidence, avoiding overreliance on imprecise imputed values. Our extensive experiments on the MIMIC-III and MIMIC-IV datasets demonstrate PRISM’s superior performance in predicting in-hospital mortality and 30-day readmission tasks, showcasing its effectiveness in handling EHR data sparsity. For the sake of reproducibility and further research, we have made the code publicly available at https://github.com/yhzhu99/PRISM.

arxiv情報

著者 Yinghao Zhu,Zixiang Wang,Long He,Shiyun Xie,Liantao Ma,Chengwei Pan
発行日 2024-01-25 17:14:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク