Synthetic ECG Signal Generation using Probabilistic Diffusion Models

要約

深層学習画像処理モデルは、近年、高品質の画像の生成において目覚ましい成功を収めています。
特に、改良型ノイズ除去拡散確率モデル (DDPM) は、最先端の生成モデルよりも画質の点で優れていることが示されており、合成心電図 (ECG) 信号の生成におけるその機能を調査する動機になりました。
この研究では、合成 ECG 信号が改良型 DDPM と勾配ペナルティ付き Wasserstein GAN (WGAN-GP) モデルによって生成され、比較されます。
この目的を達成するために、DDPM を元の $2D$ 形式で利用するパイプラインを考案しました。
まず、$1D$ ECG 時系列データが $2D$ 空間に埋め込まれます。これに対して、グラミアン角加算/差分フィールド (GASF/GADF) およびマルコフ遷移フィールド (MTF) を使用して 3 つの $2D$ を生成しました。
各 ECG 時系列からの行列。これらを組み合わせると、$3$ チャネルの $2D$ データを形成します。
次に、$2D$ DDPM を使用して $2D$ $3$ チャネル合成 ECG 画像を生成します。
$1D$ ECG 信号は、$2D$ 生成された画像ファイルを $1D$ 空間に逆埋め込むことによって作成されます。
この研究は、無条件モデルと \emph{正常洞拍動} ECG 信号の生成のみに焦点を当てており、MIT-BIH 不整脈データセットの正常洞拍動クラスがトレーニング フェーズで使用されます。
各モデルによって生成された ECG 信号の \emph{品質}、\emph{分布}、\emph{信頼性}が定量的に評価され、比較されます。
私たちの結果は、提案されたパイプラインとこの論文の特定の設定では、考慮されたすべての指標において WGAN-GP モデルが DDPM よりも一貫して優れていることを示しています。

要約(オリジナル)

Deep learning image processing models have had remarkable success in recent years in generating high quality images. Particularly, the Improved Denoising Diffusion Probabilistic Models (DDPM) have shown superiority in image quality to the state-of-the-art generative models, which motivated us to investigate their capability in the generation of the synthetic electrocardiogram (ECG) signals. In this work, synthetic ECG signals are generated by the Improved DDPM and by the Wasserstein GAN with Gradient Penalty (WGAN-GP) models and then compared. To this end, we devise a pipeline to utilize DDPM in its original $2D$ form. First, the $1D$ ECG time series data are embedded into the $2D$ space, for which we employed the Gramian Angular Summation/Difference Fields (GASF/GADF) as well as Markov Transition Fields (MTF) to generate three $2D$ matrices from each ECG time series, which when put together, form a $3$-channel $2D$ datum. Then $2D$ DDPM is used to generate $2D$ $3$-channel synthetic ECG images. The $1D$ ECG signals are created by de-embedding the $2D$ generated image files back into the $1D$ space. This work focuses on unconditional models and the generation of \emph{Normal Sinus Beat} ECG signals exclusively, where the Normal Sinus Beat class from the MIT-BIH Arrhythmia dataset is used in the training phase. The \emph{quality}, \emph{distribution}, and the \emph{authenticity} of the generated ECG signals by each model are quantitatively evaluated and compared. Our results show that in the proposed pipeline and in the particular setting of this paper, the WGAN-GP model is consistently superior to DDPM in all the considered metrics.

arxiv情報

著者 Edmond Adib,Amanda Fernandez,Fatemeh Afghah,John Jeff Prevost
発行日 2023-05-22 16:15:54+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, eess.SP パーマリンク