Toward Cohort Intelligence: A Universal Cohort Representation Learning Framework for Electronic Health Record Analysis

要約

タイトル:エレクトロニック健康記録分析のための普遍的なコホート表現学習フレームワークへの取り組み

要約:

・EHR(電子健康記録)は、幅広い患者集団の貴重な情報を記録する臨床ルーチンケアから生成され、臨床実践における患者管理や介入戦略の改善のための多くの機会を提供します。
・EHRの情報を利用するためには、機械学習における一般的なEHRデータ分析のパラダイムであるEHR表現学習があります。
・EHR表現学習は、最初に個々の患者のEHRデータをバックボーンを利用して情報豊富な表現を学習し、表現に基づいた多様なヘルスケアのダウンストリームタスクをサポートします。
・しかしながら、このような方法は、一般的には臨床実践においてコホート研究として知られる患者の関連性の深い分析にアクセスできません。
・この論文では、患者間の精緻なコホート情報を利用することにより、EHR利用を強化するための普遍的なCORE(コホート表現学習)フレームワークを提案します。
・COREは、まず、患者の先行知識に基づいて、患者間の潜在的な関連性を測定して、各患者のために適応的にコホートを分割する明示的な患者モデリングタスクを開発します。
・構築されたコホートに基づいて、COREは、イントラコホートおよびインターコホートの視点から事前に抽出されたEHRデータ表現を再符号化し、拡張されたEHRデータ表現学習を提供します。
・COREは、普遍的なプラグインフレームワークとして、さまざまなバックボーンモデルに適用でき、ヘルスケア方法にコホート情報を注入してパフォーマンスを向上させます。
・2つの現実的なデータセットでの広範な実験評価を行い、実験結果はCOREの効果性と汎用性を示しています。

要約(オリジナル)

Electronic Health Records (EHR) are generated from clinical routine care recording valuable information of broad patient populations, which provide plentiful opportunities for improving patient management and intervention strategies in clinical practice. To exploit the enormous potential of EHR data, a popular EHR data analysis paradigm in machine learning is EHR representation learning, which first leverages the individual patient’s EHR data to learn informative representations by a backbone, and supports diverse health-care downstream tasks grounded on the representations. Unfortunately, such a paradigm fails to access the in-depth analysis of patients’ relevance, which is generally known as cohort studies in clinical practice. Specifically, patients in the same cohort tend to share similar characteristics, implying their resemblance in medical conditions such as symptoms or diseases. In this paper, we propose a universal COhort Representation lEarning (CORE) framework to augment EHR utilization by leveraging the fine-grained cohort information among patients. In particular, CORE first develops an explicit patient modeling task based on the prior knowledge of patients’ diagnosis codes, which measures the latent relevance among patients to adaptively divide the cohorts for each patient. Based on the constructed cohorts, CORE recodes the pre-extracted EHR data representation from intra- and inter-cohort perspectives, yielding augmented EHR data representation learning. CORE is readily applicable to diverse backbone models, serving as a universal plug-in framework to infuse cohort information into healthcare methods for boosted performance. We conduct an extensive experimental evaluation on two real-world datasets, and the experimental results demonstrate the effectiveness and generalizability of CORE.

arxiv情報

著者 Changshuo Liu,Wenqiao Zhang,Lingze Zeng,Beng Chin Ooi,James Wei Luen Yip,Kaiping Zheng
発行日 2023-04-10 09:12:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.LG パーマリンク