FineEHR: Refine Clinical Note Representations to Improve Mortality Prediction

要約

タイトル:FineEHR: 死亡予測を改善するための臨床ノート表現の改良
要約:
– ICUの患者の健康状態を監視することは、彼らにより良いケアと治療を提供するために重要です。
– 大量の生の電子医療記録(EHR)は、機械学習モデルにより正確な予測を行うためにより多くの臨床テキストやバイタルサインを提供します。
– 現在、多くの高度なNLPモデルが臨床ノートの分析に登場していますが、生の臨床データの複雑なテキスト構造とノイズのため、ドメイン固有の細かい埋め込み手法がないと精度の向上が限られています。
– この問題に対処するために、私たちはFINEEHRを提案しました。このシステムは、異なる健康状態やノートカテゴリの間の内部相関を利用して、メトリック学習とファインチューニングの2つの表現学習技術を採用して、臨床ノート埋め込みを改良します。
– 私たちは、実世界のMIMIC IIIデータセット上でAUCおよびAUC-PRの2つのメトリックを使用して、FINEEHRの性能を評価しました。実験結果は、両方の改良手法が予測精度を向上させ、その組み合わせが最良の結果を示すことを示しています。様々な分類器での平均AUCは96.04%、平均AUC-PRは96.48%であり、以前の研究を上回り、AUCが10%以上向上しました。

要約(オリジナル)

Monitoring the health status of patients in the ICU is crucial for providing them with better care and treatment. Massive raw electronic health records (EHR) give machine learning models more clinical texts and vital signs to make accurate predictions. Currently, many advanced NLP models have emerged for clinical note analysis. However, due to the complicated textual structure and noise in raw clinical data, coarse embedding approaches without domain-specific refining limit the accuracy improvement. To address this issue, we propose FINEEHR, a system adopting two representation learning techniques, including metric learning and fine-tuning, to refine clinical note embeddings, utilizing the inner correlation among different health statuses and note categories. We evaluate the performance of FINEEHR using two metrics, AUC and AUC-PR, on a real-world MIMIC III dataset. Our experimental results demonstrate that both refining approaches can improve prediction accuracy, and their combination presents the best results. It outperforms previous works, achieving an AUC improvement of over 10%, with an average AUC of 96.04% and an average AUC-PR of 96.48% across various classifiers.

arxiv情報

著者 Jun Wu,Xuesong Ye,Chengjie Mou,Weinan Dai
発行日 2023-04-24 02:42:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, I.2 パーマリンク