Knowledge Enhanced Conditional Imputation for Healthcare Time-series

要約

本研究では、多変量時系列データにおける欠損データの課題に対処するための新しいアプローチを、特に医療データの複雑性に焦点を当てて提示する。我々のCSAI(Conditional Self-Attention Imputation)モデルは、変換器ベースのフレームワークに基づき、医療時系列データの複雑性に合わせた条件付き隠れ状態初期化を導入する。この手法は、医療データセットにおいて見落とされがちな欠測データ分布の不均衡を特にターゲットとすることで、従来のインピュテーション手法とは一線を画す。高度な知識埋め込みと非均一マスキング戦略を統合することで、CSAIは電子カルテ(EHR)における欠損データの明確なパターンに巧みに適応する。

要約(オリジナル)

This study presents a novel approach to addressing the challenge of missing data in multivariate time series, with a particular focus on the complexities of healthcare data. Our Conditional Self-Attention Imputation (CSAI) model, grounded in a transformer-based framework, introduces a conditional hidden state initialization tailored to the intricacies of medical time series data. This methodology diverges from traditional imputation techniques by specifically targeting the imbalance in missing data distribution, a crucial aspect often overlooked in healthcare datasets. By integrating advanced knowledge embedding and a non-uniform masking strategy, CSAI adeptly adjusts to the distinct patterns of missing data in Electronic Health Records (EHRs).

arxiv情報

著者 Linglong Qian,Zina Ibrahim,Hugh Logan Ellis,Ao Zhang,Yuezhou Zhang,Tao Wang,Richard Dobson
発行日 2024-01-04 13:17:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.LG パーマリンク