PheME: A deep ensemble framework for improving phenotype prediction from multi-modal data

要約

【タイトル】PheME:マルチモーダルデータからの表現型予測を改善する深層アンサンブルフレームワーク

【要約】
-詳細な表現型情報は、疾患の正確な診断とリスク評価に必要である。
-電子健康記録(EHR)は、多様な表現型情報の豊富な情報源として、診断的バリアントの解釈を可能にする。
-EHRデータから表現型を正確かつ効率的に抽出する方法は、課題である。
-PheMEは、構造化されたEHRデータと非構造化の臨床ノートのマルチモーダルデータを使用して、正確な表現型予測を行うアンサンブルフレームワークである。
-最初に、複数のディープニューラルネットワークを使用して、疎な構造化EHRデータと冗長な臨床ノートから信頼できる表現を学習する。
-その後、マルチモーダルモデルは、マルチモーダル機能を同じ潜在空間に配置して表現型を予測する。
-次に、アンサンブル学習を活用して、単一モーダルモデルとマルチモーダルモデルの出力を組み合わせて、表現型予測を改善する。
-提案されたフレームワークの表現型予測性能を評価するために、7つの疾患を選択する。
-実験結果は、マルチモーダルデータを使用することで、すべての疾患の表現型予測が有意に改善され、提案されたアンサンブル学習フレームワークによってさらに性能が向上することを示している。

要約(オリジナル)

Detailed phenotype information is fundamental to accurate diagnosis and risk estimation of diseases. As a rich source of phenotype information, electronic health records (EHRs) promise to empower diagnostic variant interpretation. However, how to accurately and efficiently extract phenotypes from the heterogeneous EHR data remains a challenge. In this work, we present PheME, an Ensemble framework using Multi-modality data of structured EHRs and unstructured clinical notes for accurate Phenotype prediction. Firstly, we employ multiple deep neural networks to learn reliable representations from the sparse structured EHR data and redundant clinical notes. A multi-modal model then aligns multi-modal features onto the same latent space to predict phenotypes. Secondly, we leverage ensemble learning to combine outputs from single-modal models and multi-modal models to improve phenotype predictions. We choose seven diseases to evaluate the phenotyping performance of the proposed framework. Experimental results show that using multi-modal data significantly improves phenotype prediction in all diseases, the proposed ensemble learning framework can further boost the performance.

arxiv情報

著者 Shenghan Zhang,Haoxuan Li,Ruixiang Tang,Sirui Ding,Laila Rasmy,Degui Zhi,Na Zou,Xia Hu
発行日 2023-04-26 20:40:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL, cs.LG, cs.MM, q-bio.QM パーマリンク