要約
本研究では、多変量時系列データにおける欠損データの課題に対処するための新しいアプローチを、特に医療データの複雑性に焦点を当てて提示する。我々のCSAI(Conditional Self-Attention Imputation)モデルは、変換器ベースのフレームワークに基づき、医療時系列データの複雑性に合わせた条件付き隠れ状態初期化を導入する。この手法は、医療データセットにおいて見落とされがちな欠測データ分布の不均衡を特にターゲットとすることで、従来のインピュテーション手法とは一線を画す。高度な知識埋め込みと非均一マスキング戦略を統合することで、CSAIは電子カルテ(EHR)における欠損データの明確なパターンに巧みに適応する。
要約(オリジナル)
This study presents a novel approach to addressing the challenge of missing data in multivariate time series, with a particular focus on the complexities of healthcare data. Our Conditional Self-Attention Imputation (CSAI) model, grounded in a transformer-based framework, introduces a conditional hidden state initialization tailored to the intricacies of medical time series data. This methodology diverges from traditional imputation techniques by specifically targeting the imbalance in missing data distribution, a crucial aspect often overlooked in healthcare datasets. By integrating advanced knowledge embedding and a non-uniform masking strategy, CSAI adeptly adjusts to the distinct patterns of missing data in Electronic Health Records (EHRs).
arxiv情報
著者 | Linglong Qian,Zina Ibrahim,Hugh Logan Ellis,Ao Zhang,Yuezhou Zhang,Tao Wang,Richard Dobson |
発行日 | 2024-01-04 13:17:07+00:00 |
arxivサイト | arxiv_id(pdf) |