A Domain Translation Framework with an Adversarial Denoising Diffusion Model to Generate Synthetic Datasets of Echocardiography Images

要約

現在、医療画像ドメインの翻訳業務は、研究者や臨床医からの高い需要を示しています。
他の機能の中でも特に、このタスクにより、十分に高い画質を備えた新しい医用画像の生成が可能になり、臨床的に関連性のあるものになります。
深層学習 (DL) アーキテクチャ、特に深層生成モデルは、画像を生成し、あるドメインから別のドメインに変換するために広く使用されています。
提案されたフレームワークは、敵対的ノイズ除去拡散モデル (DDM) に依存して心エコー画像を合成し、ドメイン変換を実行します。
Generative Adversarial Networks (GAN) とは対照的に、DDM は多様性に富んだ高品質の画像サンプルを生成できます。
DDM を GAN と組み合わせると、新しいデータを生成する機能がさらに高速なサンプリング時間で完了します。
この研究では、GAN と組み合わせた敵対的 DDM をトレーニングして、ガイド画像に依存して逆ノイズ除去プロセスを学習し、各心エコー画像の関連する解剖学的構造が保持され、生成された画像サンプル上に表現されていることを確認しました。
いくつかのドメイン変換操作の結果、このような生成モデルが高品質の画像サンプルを合成できることが検証されました: MSE: 11.50 +/- 3.69、PSNR (dB): 30.48 +/- 0.09、SSIM: 0.47 +/- 0.03。
提案手法は高い汎用性を示し、臨床研究用途に適した心エコー画像を作成するフレームワークを導入しました。

要約(オリジナル)

Currently, medical image domain translation operations show a high demand from researchers and clinicians. Amongst other capabilities, this task allows the generation of new medical images with sufficiently high image quality, making them clinically relevant. Deep Learning (DL) architectures, most specifically deep generative models, are widely used to generate and translate images from one domain to another. The proposed framework relies on an adversarial Denoising Diffusion Model (DDM) to synthesize echocardiography images and perform domain translation. Contrary to Generative Adversarial Networks (GANs), DDMs are able to generate high quality image samples with a large diversity. If a DDM is combined with a GAN, this ability to generate new data is completed at an even faster sampling time. In this work we trained an adversarial DDM combined with a GAN to learn the reverse denoising process, relying on a guide image, making sure relevant anatomical structures of each echocardiography image were kept and represented on the generated image samples. For several domain translation operations, the results verified that such generative model was able to synthesize high quality image samples: MSE: 11.50 +/- 3.69, PSNR (dB): 30.48 +/- 0.09, SSIM: 0.47 +/- 0.03. The proposed method showed high generalization ability, introducing a framework to create echocardiography images suitable to be used for clinical research purposes.

arxiv情報

著者 Cristiana Tiago,Sten Roar Snare,Jurica Sprem,Kristin McLeod
発行日 2024-03-07 15:58:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, eess.IV パーマリンク