IGNITE: Individualized GeNeration of Imputations in Time-series Electronic health records

要約

電子健康記録は、個人レベルの違いに合わせて治療を調整する個別化医療を推進するための貴重な手段を提供します。
この目的のために、多くのデータ駆動型機械学習および統計モデルは、患者の生理学的効果および治療効果を研究するために豊富な長期的 EHR に依存しています。
ただし、縦方向の EHR はまばらで欠損が多い傾向があり、欠損も有益であり、根底にある患者の健康状態を反映している可能性があります。
したがって、個別化医療のためのデータ駆動型モデルの成功は、EHR データが生理学的データ、治療法、およびデータ内の欠損値からどのように表現されるかに大きく依存します。
この目的を達成するために、私たちは、多変量データにわたって基礎となる患者の動態を経時的に学習し、個人の人口統計的特徴と治療法を条件付けたパーソナライズされた現実的な値を生成する、新しい深層学習モデルを提案します。
私たちが提案するモデルである IGNITE (Individualized GeNeration of Imputations in Time-series Electronic health records) は、個人の欠損値を生成するために、デュアルステージ アテンションで強化された条件付き二重変量オートエンコーダーを利用します。
IGNITE では、新しい個人化欠損マスク (IMM) をさらに提案します。これは、モデルが個人の観察データと欠損パターンに基づいて値を生成するのに役立ちます。
さらに、IGNITE の使用を欠損値の補完からパーソナライズされたデータ シンセサイザーに拡張し、これまで観察されたことのない欠損 EHR を生成したり、さまざまなアプリケーションで新しい患者を生成したりすることもできます。
私たちは、公開されている 3 つの大規模なデータセットでモデルを検証し、欠損データの再構成とタスク予測において IGNITE が最先端のアプローチよりも優れていることを示しました。

要約(オリジナル)

Electronic Health Records present a valuable modality for driving personalized medicine, where treatment is tailored to fit individual-level differences. For this purpose, many data-driven machine learning and statistical models rely on the wealth of longitudinal EHRs to study patients’ physiological and treatment effects. However, longitudinal EHRs tend to be sparse and highly missing, where missingness could also be informative and reflect the underlying patient’s health status. Therefore, the success of data-driven models for personalized medicine highly depends on how the EHR data is represented from physiological data, treatments, and the missing values in the data. To this end, we propose a novel deep-learning model that learns the underlying patient dynamics over time across multivariate data to generate personalized realistic values conditioning on an individual’s demographic characteristics and treatments. Our proposed model, IGNITE (Individualized GeNeration of Imputations in Time-series Electronic health records), utilises a conditional dual-variational autoencoder augmented with dual-stage attention to generate missing values for an individual. In IGNITE, we further propose a novel individualized missingness mask (IMM), which helps our model generate values based on the individual’s observed data and missingness patterns. We further extend the use of IGNITE from imputing missingness to a personalized data synthesizer, where it generates missing EHRs that were never observed prior or even generates new patients for various applications. We validate our model on three large publicly available datasets and show that IGNITE outperforms state-of-the-art approaches in missing data reconstruction and task prediction.

arxiv情報

著者 Ghadeer O. Ghosheh,Jin Li,Tingting Zhu
発行日 2024-12-13 14:04:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク