Automated Medical Report Generation for ECG Data: Bridging Medical Text and Signal Processing with Deep Learning


この研究では、これらのキャプション技術を適用して、ECG データの臨床医のような解釈を生成します。
この研究では、医療専門家 (HCP) が作成した自由テキストのレポートをトレーニング データとして伴う既存の ECG データセットを活用しています。
これらのレポートを使用してモデルをトレーニングし、ECG エピソードの詳細な説明を生成するエンコーダー デコーダー ベースの方法を紹介します。
これは、ECG 分析の自動化における大幅な進歩を表しており、ゼロショット分類や自動臨床意思決定サポートに応用できる可能性があります。
このモデルは、1 誘導 ECG と 12 誘導 ECG の両方を含むさまざまなデータセットでテストされています。
これは Qiu らによる最先端の参照モデルを大幅に上回り、METEOR スコアは 55.53% で、これに対して参照モデルでは 24.51% でした。
この研究のソース コードは、Git リポジトリ で公開されています。


Recent advances in deep learning and natural language generation have significantly improved image captioning, enabling automated, human-like descriptions for visual content. In this work, we apply these captioning techniques to generate clinician-like interpretations of ECG data. This study leverages existing ECG datasets accompanied by free-text reports authored by healthcare professionals (HCPs) as training data. These reports, while often inconsistent, provide a valuable foundation for automated learning. We introduce an encoder-decoder-based method that uses these reports to train models to generate detailed descriptions of ECG episodes. This represents a significant advancement in ECG analysis automation, with potential applications in zero-shot classification and automated clinical decision support. The model is tested on various datasets, including both 1- and 12-lead ECGs. It significantly outperforms the state-of-the-art reference model by Qiu et al., achieving a METEOR score of 55.53% compared to 24.51% achieved by the reference model. Furthermore, several key design choices are discussed, providing a comprehensive overview of current challenges and innovations in this domain. The source codes for this research are publicly available in our Git repository


著者 Amnon Bleich,Antje Linnemann,Bjoern H. Diem,Tim OF Conrad
発行日 2024-12-05 11:05:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.CL パーマリンク