要約
心電図 (ECG) は、臨床現場で心臓不整脈疾患を検出するために不可欠な非侵襲的診断ツールです。
ECG 自己教師あり学習 (eSSL) 手法は、注釈のない ECG データからの表現学習において有望である一方で、レポートに含まれる臨床知識を見落とすことがよくあります。
この見落としと、ダウンストリーム タスク用の注釈付きサンプルの要件により、eSSL の汎用性が制限されます。
この研究では、マルチモーダル ECG 表現学習 (MERL}) フレームワークを使用してこれらの問題に対処します。
MERL は、ECG 記録と関連レポートのマルチモーダル学習を通じて、テキスト プロンプトを使用してゼロショット ECG 分類を実行できるため、下流タスクでのトレーニング データの必要性がなくなります。
テスト時には、大規模言語モデル (LLM) を使用して専門家が検証した外部の臨床知識データベースを活用する臨床知識強化プロンプト エンジニアリング (CKEPE) アプローチを提案します。これにより、より説明的なプロンプトが生成され、LLM で生成されたコンテンツの幻覚が減少してゼロを改善します。
-ショットの分類。
MERL に基づいて、6 つの公開 ECG データセットにわたって最初のベンチマークを実行し、eSSL 方式と比較した MERL の優れたパフォーマンスを示しました。
特に、MERL は、ゼロショット分類 (トレーニング データなし) で 75.2% の平均 AUC スコアを達成しています。これは、6 つのデータセットすべての平均で、10\% の注釈付きトレーニング データを使用した線形プローブ eSSL メソッドより 3.2% 高いです。
要約(オリジナル)
Electrocardiograms (ECGs) are non-invasive diagnostic tools crucial for detecting cardiac arrhythmic diseases in clinical practice. While ECG Self-supervised Learning (eSSL) methods show promise in representation learning from unannotated ECG data, they often overlook the clinical knowledge that can be found in reports. This oversight and the requirement for annotated samples for downstream tasks limit eSSL’s versatility. In this work, we address these issues with the Multimodal ECG Representation Learning (MERL}) framework. Through multimodal learning on ECG records and associated reports, MERL is capable of performing zero-shot ECG classification with text prompts, eliminating the need for training data in downstream tasks. At test time, we propose the Clinical Knowledge Enhanced Prompt Engineering (CKEPE) approach, which uses Large Language Models (LLMs) to exploit external expert-verified clinical knowledge databases, generating more descriptive prompts and reducing hallucinations in LLM-generated content to boost zero-shot classification. Based on MERL, we perform the first benchmark across six public ECG datasets, showing the superior performance of MERL compared against eSSL methods. Notably, MERL achieves an average AUC score of 75.2% in zero-shot classification (without training data), 3.2% higher than linear probed eSSL methods with 10\% annotated training data, averaged across all six datasets.
arxiv情報
著者 | Che Liu,Zhongwei Wan,Cheng Ouyang,Anand Shah,Wenjia Bai,Rossella Arcucci |
発行日 | 2024-03-11 12:28:55+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google