ECG-Image-Kit: A Synthetic Image Generation Toolbox to Facilitate Deep Learning-Based Electrocardiogram Digitization

要約

時系列データから現実的なアーティファクトを含む合成 ECG 画像を生成するオープンソース ツールボックスである ECG-Image-Kit を紹介し、データ拡張と ECG 画像デジタル化のためのアルゴリズムの開発におけるそのアプリケーションを紹介します。
合成データは、標準的な ECG 用紙の背景に歪みのない ECG 画像を生成することによって生成されます。
その後、手書きのテキストアーチファクト、しわ、しわ、遠近法変換などのさまざまな歪みがこれらの ECG 画像に適用されます。
アーティファクトとテキストは、個人を特定できる情報を除いて、合成的に生成されます。
このツールボックスは、ECG 画像のデジタル化と分類に関する 2024 PhysioNet Challenge のデータ拡張に使用されます。
ケーススタディとして、ECG-Image-Kit を使用して、PhysioNet QT データベースから 21,801 レコードの ECG 画像データセットを作成しました。
ノイズ除去畳み込みニューラル ネットワーク (DnCNN) ベースのモデルが開発され、この合成データセットでトレーニングされ、合成で生成された画像を評価のために時系列データに変換するために使用されました。
SNR は、グラウンド トゥルース ECG 時系列と比較して画像デジタル化の品質を評価するために計算されました。
結果は、平均信号回復 SNR が 11.17 +/- 9.19 dB であることを示しており、深層学習モデルのトレーニングにおける合成 ECG 画像データセットの重要性を示しています。
臨床評価のために、推定時系列データとグラウンドトゥルース時系列データのRR間隔とQT間隔の間の誤差を測定しました。
推定された RR 間隔と QT 間隔の精度も、それぞれの臨床パラメーターが維持されていることを示唆しています。
これらの結果は、紙の心電図を正確にデジタル化する際の深層学習ベースのパイプラインの有効性を実証し、デジタル化への生成的アプローチを強調しています。

要約(オリジナル)

We introduce ECG-Image-Kit, an open-source toolbox for generating synthetic ECG images with realistic artifacts from time-series data, and showcase its application in developing algorithms for data augmentation and ECG image digitization. Synthetic data is generated by producing distortionless ECG images on a standard ECG paper background. Subsequently, various distortions, including handwritten text artifacts, wrinkles, creases, and perspective transformations, are applied to these ECG images. The artifacts and text are synthetically generated, excluding personally identifiable information. The toolbox is used for data augmentation in the 2024 PhysioNet Challenge on Digitization and Classification of ECG Images. As a case study, we employed ECG-Image-Kit to create an ECG image dataset of 21,801 records from the PhysioNet QT database. A denoising convolutional neural network (DnCNN)-based model was developed and trained on this synthetic dataset and used to convert the synthetically generated images back into time-series data for evaluation. SNR was calculated to assess the quality of image digitization compared to the ground truth ECG time-series. The results show an average signal recovery SNR of 11.17 +/- 9.19 dB, indicating the synthetic ECG image dataset’s significance for training deep learning models. For clinical evaluation, we measured the error between the estimated and ground-truth time-series data’s RR and QT-intervals. The accuracy of the estimated RR and QT-intervals also suggests that the respective clinical parameters are maintained. These results demonstrate the effectiveness of a deep learning-based pipeline in accurately digitizing paper ECGs and highlight a generative approach to digitization.

arxiv情報

著者 Kshama Kodthalu Shivashankara,Deepanshi,Afagh Mehri Shervedani,Gari D. Clifford,Matthew A. Reyna,Reza Sameni
発行日 2024-01-26 18:59:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク