Toward Cohort Intelligence: A Universal Cohort Representation Learning Framework for Electronic Health Record Analysis

要約

タイトル:電子健康記録の分析のための汎用的なコホート表現学習フレームワークに向けて

要約:
– 電子健康記録は、広範囲の患者集団の貴重な情報を記録するため、臨床ルーチンケアから生成されます。
– EHR表現学習は、個々の患者のEHRデータをバックボーンで学習し、その表現を元に多様な医療下流タスクをサポートする機械学習の一般的な手法です。
– しかしながら、これでは一人ひとりの患者の分析を行うことはできますが、コホート研究に必要な患者間の深い分析を行うことはできません。
– 本論文では、Universal COhort Representation lEarning (CORE) フレームワークを提案し、患者間の詳細なコホート情報を活用することでEHRの利用価値を向上させます。
– COREは、患者の診断コードに基づいた明示的な患者モデリングタスクを開発し、患者間の関連性を測定し、各患者ごとに適応的にコホートを分割します。分割されたコホートを元に、COREは患者表現を再コードします。
– COREは、多様なバックボーンモデルに対応することができ、医療関係の方法にコホート情報を注入するための汎用的なプラグインフレームワークとして機能します。
– 2つの実世界のデータセットに対して広範な実験評価を行い、実験結果はCOREの効果的かつ汎用的な性能を示します。

要約(オリジナル)

Electronic Health Records (EHR) are generated from clinical routine care recording valuable information of broad patient populations, which provide plentiful opportunities for improving patient management and intervention strategies in clinical practice. To exploit the enormous potential of EHR data, a popular EHR data analysis paradigm in machine learning is EHR representation learning, which first leverages the individual patient’s EHR data to learn informative representations by a backbone, and supports diverse health-care downstream tasks grounded on the representations. Unfortunately, such a paradigm fails to access the in-depth analysis of patients’ relevance, which is generally known as cohort studies in clinical practice. Specifically, patients in the same cohort tend to share similar characteristics, implying their resemblance in medical conditions such as symptoms or diseases. In this paper, we propose a universal COhort Representation lEarning (CORE) framework to augment EHR utilization by leveraging the fine-grained cohort information among patients. In particular, CORE first develops an explicit patient modeling task based on the prior knowledge of patients’ diagnosis codes, which measures the latent relevance among patients to adaptively divide the cohorts for each patient. Based on the constructed cohorts, CORE recodes the pre-extracted EHR data representation from intra- and inter-cohort perspectives, yielding augmented EHR data representation learning. CORE is readily applicable to diverse backbone models, serving as a universal plug-in framework to infuse cohort information into healthcare methods for boosted performance. We conduct an extensive experimental evaluation on two real-world datasets, and the experimental results demonstrate the effectiveness and generalizability of CORE.

arxiv情報

著者 Changshuo Liu,Wenqiao Zhang,Lingze Zeng,Beng Chin Ooi,James Wei Luen Yip,Kaiping Zheng
発行日 2023-04-11 15:15:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.LG パーマリンク