AnyECG: Foundational Models for Multitask Cardiac Analysis in Real-World Settings

要約

心電図(ECG)は、非侵襲的で安価な心臓モニタリングのツールであり、急性の心臓発作を検出する上で高感度である。しかし、心電図記録は長時間に及ぶため、人間の作業負担を軽減するために、自動心臓病検出のための機械学習手法が数多く開発されてきた。こうした努力にもかかわらず、性能は依然として最適とはいえない。主な障害は、ECGデータ固有の複雑さである。ECGデータには、不均一性(サンプリングレートの変化など)、高レベルのノイズ、人口統計に関連したパターンのシフト、複雑なリズムとイベントの関連性などが含まれる。これらの課題を克服するために、本論文では、あらゆる実世界のECGデータからロバストな表現を抽出するように設計された基盤モデルであるAnyECGを紹介します。具体的には、ECGトーケナイザが各固定時間ECGフラグメントをトークンにエンコードし、プロキシタスクに導かれて、ノイズの多い連続的なECG特徴を離散的でコンパクトな臨床的に意味のあるローカルなリズムコードに変換します。これらのコードは基本的な形態学的、周波数、および人口統計学的情報(性別など)をカプセル化し、信号ノイズを効果的に軽減します。さらに、ECGトークン間のリズムパターンの関連付けを学習するためにAnyECGを事前トレーニングし、心イベントのセマンティクスの捕捉を可能にします。多様なECGデータソースに対して共同で事前学習することで、AnyECGはECG信号がさまざまなデバイスやシナリオから記録される幅広いダウンストリームタスクに汎化することができます。実験結果によると、AnyECGは4つの重要なタスク(異常検出、不整脈分類、破損リード生成、超長時間ECG認識)において平均6%の性能向上を達成しています。AnyECGはデータから一般的なECGリズムを学習し、これらのタスクのそれぞれで最先端の手法を大幅に上回っています。

要約(オリジナル)

Electrocardiogram (ECG), a non-invasive and affordable tool for cardiac monitoring, is highly sensitive in detecting acute heart attacks. However, due to the lengthy nature of ECG recordings, numerous machine learning methods have been developed for automated heart disease detection to reduce human workload. Despite these efforts, performance remains suboptimal. A key obstacle is the inherent complexity of ECG data, which includes heterogeneity (e.g., varying sampling rates), high levels of noise, demographic-related pattern shifts, and intricate rhythm-event associations. To overcome these challenges, this paper introduces AnyECG, a foundational model designed to extract robust representations from any real-world ECG data. Specifically, a tailored ECG Tokenizer encodes each fixed-duration ECG fragment into a token and, guided by proxy tasks, converts noisy, continuous ECG features into discrete, compact, and clinically meaningful local rhythm codes. These codes encapsulate basic morphological, frequency, and demographic information (e.g., sex), effectively mitigating signal noise. We further pre-train the AnyECG to learn rhythmic pattern associations across ECG tokens, enabling the capture of cardiac event semantics. By being jointly pre-trained on diverse ECG data sources, AnyECG is capable of generalizing across a wide range of downstream tasks where ECG signals are recorded from various devices and scenarios. The experimental results show that AnyECG achieves an average performance improvement of 6% across four critical tasks-anomaly detection, arrhythmia classification, corrupted lead generation, and ultra-long ECG recognition. AnyECG learns common ECG rhythm from data and significantly outperforms state-of-the-art methods in each of these tasks.

arxiv情報

著者 Yue Wang,Xu Cao,Yaojun Hu,Haochao Ying,Hongxia Xu,Ruijia Wu,James Matthew Rehg,Jimeng Sun,Jian Wu,Jintai Chen
発行日 2025-03-03 13:19:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.LG, eess.SP パーマリンク