Conditional Diffusion Models for Semantic 3D Medical Image Synthesis


医療における人工知能 (AI) の需要は急速に高まっています。
既存の生成モデルは画像合成や画像間の変換タスクでは成功を収めていますが、3D セマンティック医用画像の生成にはまだギャップが残っています。
このギャップに対処するために、セマンティック 3D 医用画像合成用に特別に設計された普及モデルである Med-DDPM を導入し、データ不足とプライバシーの問題に効果的に取り組みます。
Med-DDPM の新規性は、画像生成プロセス中に正確な制御を可能にするセマンティック コンディショニングを組み込んでいることにあります。
私たちのモデルは、安定性とパフォーマンスの点で敵対的生成ネットワーク (GAN) よりも優れており、視覚的な忠実度が高く、解剖学的に一貫した多様な画像を生成します。
最先端の拡張技術との比較分析により、Med-DDPM が同等の結果を生み出すことが実証され、モデルの精度を向上させるデータ拡張ツールとしての可能性が強調されています。
結論として、Med-DDPM は、高品質で解剖学的に一貫した画像を提供することで、3D セマンティック医用画像合成の先駆けとなります。
さらに、セマンティックコンディショニングと Med-DDPM の統合は、生物医学イメージングの分野における画像の匿名化に有望であり、データ不足とプライバシーの懸念に関連する課題に対処するモデルの機能を示しています。
コードとモデルの重みは、GitHub リポジトリ ( で公開されており、再現性が容易になります。


The demand for artificial intelligence (AI) in healthcare is rapidly increasing. However, significant challenges arise from data scarcity and privacy concerns, particularly in medical imaging. While existing generative models have achieved success in image synthesis and image-to-image translation tasks, there remains a gap in the generation of 3D semantic medical images. To address this gap, we introduce Med-DDPM, a diffusion model specifically designed for semantic 3D medical image synthesis, effectively tackling data scarcity and privacy issues. The novelty of Med-DDPM lies in its incorporation of semantic conditioning, enabling precise control during the image generation process. Our model outperforms Generative Adversarial Networks (GANs) in terms of stability and performance, generating diverse and anatomically coherent images with high visual fidelity. Comparative analysis against state-of-the-art augmentation techniques demonstrates that Med-DDPM produces comparable results, highlighting its potential as a data augmentation tool for enhancing model accuracy. In conclusion, Med-DDPM pioneers 3D semantic medical image synthesis by delivering high-quality and anatomically coherent images. Furthermore, the integration of semantic conditioning with Med-DDPM holds promise for image anonymization in the field of biomedical imaging, showcasing the capabilities of the model in addressing challenges related to data scarcity and privacy concerns. Our code and model weights are publicly accessible on our GitHub repository at, facilitating reproducibility.


著者 Zolnamar Dorjsembe,Hsing-Kuo Pao,Sodtavilan Odonchimed,Furen Xiao
発行日 2023-07-31 12:13:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク