Masked Transformer for Electrocardiogram Classification

要約

心電図 (ECG) は、臨床応用において最も重要な診断ツールの 1 つです。
高度なアルゴリズムの出現により、さまざまな深層学習モデルが ECG タスクに採用されています。
ただし、コンピューター ビジョンと自然言語処理で広く成功を収めているにもかかわらず、ECG データに対する Transformers の可能性はまだ実現されていません。
この研究では、マスクされたオートエンコーダの適用を ECG 時系列に拡張する、MTECG と呼ばれる ECG 分類に有用なマスクされた Transformer メソッドを紹介します。
MTECG の特性を調査するために、医療専門家によって注釈が付けられた幅広い診断を含む 220,251 件の ECG 記録で構成されるデータセットを構築します。
提案されたトレーニング戦略の下では、570 万のパラメーターを持つ軽量モデルは、広範囲のマスキング率 (5% ~ 75%) で安定して良好なパフォーマンスを発揮します。
アブレーション研究では、変動する再構成ターゲット、トレーニング スケジュールの長さ、層ごとの LR 減衰、DropPath レートの重要性が強調されています。
プライベートおよびパブリックの両方の ECG データセットでの実験により、MTECG-T が ECG 分類において最近の最先端のアルゴリズムを大幅に上回ることが実証されました。

要約(オリジナル)

Electrocardiogram (ECG) is one of the most important diagnostic tools in clinical applications. With the advent of advanced algorithms, various deep learning models have been adopted for ECG tasks. However, the potential of Transformers for ECG data is not yet realized, despite their widespread success in computer vision and natural language processing. In this work, we present a useful masked Transformer method for ECG classification referred to as MTECG, which expands the application of masked autoencoders to ECG time series. We construct a dataset comprising 220,251 ECG recordings with a broad range of diagnoses annoated by medical experts to explore the properties of MTECG. Under the proposed training strategies, a lightweight model with 5.7M parameters performs stably well on a broad range of masking ratios (5%-75%). The ablation studies highlight the importance of fluctuated reconstruction targets, training schedule length, layer-wise LR decay and DropPath rate. The experiments on both private and public ECG datasets demonstrate that MTECG-T significantly outperforms the recent state-of-the-art algorithms in ECG classification.

arxiv情報

著者 Ya Zhou,Xiaolin Diao,Yanni Huo,Yang Liu,Xiaohan Fan,Wei Zhao
発行日 2024-04-22 13:01:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, eess.SP, stat.AP パーマリンク