Toward Cohort Intelligence: A Universal Cohort Representation Learning Framework for Electronic Health Record Analysis

要約

タイトル: 電子健康記録解析のためのユニバーサル・コホート表現学習フレームワークに向けて
要約:

– 電子健康記録(EHR)は、広範囲の患者集団の貴重な情報を記録しており、臨床現場で患者管理や介入戦略の改善のために多くの機会を提供する。
– EHRデータを活用するための機械学習において、EHR表現学習は一般的なパラダイムの一つであり、個々の患者のEHRデータをバックボーンによって解析して情報豊富な表現を学習し、その表現を基盤として多様な医療タスクをサポートする。
– しかし、このパラダイムは、患者の関連性を深く分析することができず、一般的に臨床現場でコホート研究として知られている。
– この論文では、患者間の詳細なコホート情報を活用してEHRの利用を拡張するために、ユニバーサル・コホート表現学習(CORE)フレームワークを提案する。
– COREは、患者の診断コードの事前知識に基づいて明示的な患者モデリングタスクを開発し、患者間の潜在的な関連性を測定して適応的に各患者のコホートを分割する。
– 構築されたコホートに基づいて、COREは内部および外部コホートの観点から、事前に抽出されたEHRデータ表現を再コードし、拡張EHRデータ表現学習を提供する。
– COREは、多様なバックボーンモデルに適用でき、医療方法にコホート情報を注入して性能を向上させるための汎用的なプラグインフレームワークとして機能する。
– 2つの実世界データセットに対する広範な実験評価を行い、実験結果はCOREの有効性と汎用性を示している。

要約(オリジナル)

Electronic Health Records (EHR) are generated from clinical routine care recording valuable information of broad patient populations, which provide plentiful opportunities for improving patient management and intervention strategies in clinical practice. To exploit the enormous potential of EHR data, a popular EHR data analysis paradigm in machine learning is EHR representation learning, which first leverages the individual patient’s EHR data to learn informative representations by a backbone, and supports diverse health-care downstream tasks grounded on the representations. Unfortunately, such a paradigm fails to access the in-depth analysis of patients’ relevance, which is generally known as cohort studies in clinical practice. Specifically, patients in the same cohort tend to share similar characteristics, implying their resemblance in medical conditions such as symptoms or diseases. In this paper, we propose a universal COhort Representation lEarning (CORE) framework to augment EHR utilization by leveraging the fine-grained cohort information among patients. In particular, CORE first develops an explicit patient modeling task based on the prior knowledge of patients’ diagnosis codes, which measures the latent relevance among patients to adaptively divide the cohorts for each patient. Based on the constructed cohorts, CORE recodes the pre-extracted EHR data representation from intra- and inter-cohort perspectives, yielding augmented EHR data representation learning. CORE is readily applicable to diverse backbone models, serving as a universal plug-in framework to infuse cohort information into healthcare methods for boosted performance. We conduct an extensive experimental evaluation on two real-world datasets, and the experimental results demonstrate the effectiveness and generalizability of CORE.

arxiv情報

著者 Changshuo Liu,Wenqiao Zhang,Beng Chin Ooi,James Wei Luen Yip,Lingze Zeng,Kaiping Zheng
発行日 2023-04-12 07:12:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.LG パーマリンク