Event-Based Contrastive Learning for Medical Time Series

要約

臨床現場では、重要な医療事故の後に患者が有害な転帰のリスクが高いかどうかを特定する必要があることがよくあります。
たとえば、急性心血管イベント後の有害転帰のリスクを定量化することは、医療提供者が不良転帰のリスクが最も高い患者を特定するのに役立ちます。
つまり、リスクを軽減できる侵襲的治療の恩恵を受ける患者です。
しかし、特に心不全などの慢性疾患に苦しむ個人にとって、長期にわたる医療データの複雑さ、変動性、不均一性により、有害転帰のリスクを評価することは困難です。
この論文では、キーインデックスイベントの前後の時間情報を保存する異種患者データの埋め込みを学習する方法であるイベントベース対照学習 (EBCL) を紹介します。
EBCL を使用して、他の事前トレーニング方法と比較して重要な下流タスクのパフォーマンスが向上したモデルを構築できることを実証します。
私たちは、大規模な病院ネットワークから取得した心不全患者のコホートと、大規模な三次医療センターの集中治療室にいる患者で構成される公的に利用可能な MIMIC-IV データセットを使用して、この方法を開発およびテストします。
どちらのコホートでも、EBCL 事前トレーニングにより、死亡率、再入院、在院日数など、多くの下流タスクに関してパフォーマンスの高いモデルが得られます。
さらに、教師なし EBCL 包埋は、心不全患者を効果的に異なる転帰を持つサブグループに分類するため、新しい心不全表現型の特定に役立つ情報が提供されます。
インデックス イベントを中心とした対照的なフレームワークは、幅広い時系列データセットに適応でき、個別化されたケアのガイドに使用できる情報を提供します。

要約(オリジナル)

In clinical practice, one often needs to identify whether a patient is at high risk of adverse outcomes after some key medical event. For example, quantifying the risk of adverse outcomes after an acute cardiovascular event helps healthcare providers identify those patients at the highest risk of poor outcomes; i.e., patients who benefit from invasive therapies that can lower their risk. Assessing the risk of adverse outcomes, however, is challenging due to the complexity, variability, and heterogeneity of longitudinal medical data, especially for individuals suffering from chronic diseases like heart failure. In this paper, we introduce Event-Based Contrastive Learning (EBCL) – a method for learning embeddings of heterogeneous patient data that preserves temporal information before and after key index events. We demonstrate that EBCL can be used to construct models that yield improved performance on important downstream tasks relative to other pretraining methods. We develop and test the method using a cohort of heart failure patients obtained from a large hospital network and the publicly available MIMIC-IV dataset consisting of patients in an intensive care unit at a large tertiary care center. On both cohorts, EBCL pretraining yields models that are performant with respect to a number of downstream tasks, including mortality, hospital readmission, and length of stay. In addition, unsupervised EBCL embeddings effectively cluster heart failure patients into subgroups with distinct outcomes, thereby providing information that helps identify new heart failure phenotypes. The contrastive framework around the index event can be adapted to a wide array of time-series datasets and provides information that can be used to guide personalized care.

arxiv情報

著者 Hyewon Jeong,Nassim Oufattole,Matthew Mcdermott,Aparna Balagopalan,Bryan Jangeesingh,Marzyeh Ghassemi,Collin Stultz
発行日 2024-04-19 15:51:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク