要約
ディープ ラーニングの画像処理モデルは、近年、高品質の画像を生成するという点で目覚ましい成功を収めています。
特に、改善されたノイズ除去拡散確率モデル (DDPM) は、最先端の生成モデルよりも画質が優れていることを示しており、合成心電図 (ECG) 信号の生成におけるその能力を調査する動機になりました。
この作業では、改良型 DDPM と勾配ペナルティ (WGAN-GP) モデルを使用した Wasserstein GAN によって合成 ECG 信号が生成され、比較されます。
この目的のために、元の $2D$ 形式で DDPM を利用するパイプラインを考案します。
最初に、$1D$ の ECG 時系列データが $2D$ 空間に埋め込まれます。これには、グラミアン角度加算/差分フィールド (GASF/GADF) とマルコフ遷移フィールド (MTF) を使用して 3 つの $2D$ を生成します。
各 ECG 時系列からの行列で、これらをまとめると、$3$ チャネル $2D$ データを形成します。
次に、$2D$ DDPM を使用して、$2D$ $3$ チャネルの合成 ECG 画像を生成します。
$1$D の ECG 信号は、$2D$ 生成された画像ファイルを $1D$ スペースに戻すことによって作成されます。
この作業は、無条件モデルと \emph{Normal} ECG 信号のみの生成に焦点を当てており、MIT BIH 不整脈データセットの通常クラスがトレーニング フェーズとして使用されます。
各モデルによって生成された ECG 信号の \emph{品質}、\emph{分布}、および \emph{信頼性} が比較されます。
私たちの結果は、提案されたパイプラインでは、WGAN-GP モデルは、考慮されたすべてのメトリックにおいて一貫して DDPM よりもはるかに優れていることを示しています。
要約(オリジナル)
Deep learning image processing models have had remarkable success in recent years in generating high quality images. Particularly, the Improved Denoising Diffusion Probabilistic Models (DDPM) have shown superiority in image quality to the state-of-the-art generative models, which motivated us to investigate its capability in generation of the synthetic electrocardiogram (ECG) signals. In this work, synthetic ECG signals are generated by the Improved DDPM and by the Wasserstein GAN with Gradient Penalty (WGAN-GP) models and then compared. To this end, we devise a pipeline to utilize DDPM in its original $2D$ form. First, the $1D$ ECG time series data are embedded into the $2D$ space, for which we employed the Gramian Angular Summation/Difference Fields (GASF/GADF) as well as Markov Transition Fields (MTF) to generate three $2D$ matrices from each ECG time series that, which when put together, form a $3$-channel $2D$ datum. Then $2D$ DDPM is used to generate $2D$ $3$-channel synthetic ECG images. The $1$D ECG signals are created by de-embedding the $2D$ generated image files back into the $1D$ space. This work focuses on unconditional models and the generation of only \emph{Normal} ECG signals, where the Normal class from the MIT BIH Arrhythmia dataset is used as the training phase. The \emph{quality}, \emph{distribution}, and the \emph{authenticity} of the generated ECG signals by each model are compared. Our results show that, in the proposed pipeline, the WGAN-GP model is superior to DDPM by far in all the considered metrics consistently.
arxiv情報
著者 | Edmond Adib,Amanda Fernandez,Fatemeh Afghah,John Jeff Prevost |
発行日 | 2023-03-16 15:47:32+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google