要約
新しく出現し有望なタイプの生成モデルとして、拡散モデルは、画像合成を含む複数のタスクにおいて敵対的生成ネットワーク (GAN) よりも優れたパフォーマンスを発揮することが証明されています。
この研究では、データ拡張などの下流アプリケーションに使用できる条件付き拡散モデルを使用した腹部 CT のセマンティック画像合成を検討します。
私たちは 3 つの拡散モデルと他の最先端の GAN ベースのアプローチのパフォーマンスを体系的に評価し、セマンティック マスクのさまざまな条件付けシナリオを研究しました。
実験結果では、拡散モデルの方がより高品質の腹部 CT 画像を合成できることが実証されました。
さらに、マスクと入力を別々にエンコードする方が、単純に連結するよりも効果的です。
要約(オリジナル)
As a new emerging and promising type of generative models, diffusion models have proven to outperform Generative Adversarial Networks (GANs) in multiple tasks, including image synthesis. In this work, we explore semantic image synthesis for abdominal CT using conditional diffusion models, which can be used for downstream applications such as data augmentation. We systematically evaluated the performance of three diffusion models, as well as to other state-of-the-art GAN-based approaches, and studied the different conditioning scenarios for the semantic mask. Experimental results demonstrated that diffusion models were able to synthesize abdominal CT images with better quality. Additionally, encoding the mask and the input separately is more effective than na\’ive concatenating.
arxiv情報
| 著者 | Yan Zhuang,Benjamin Hou,Tejas Sudharshan Mathai,Pritam Mukherjee,Boah Kim,Ronald M. Summers |
| 発行日 | 2023-12-11 15:39:41+00:00 |
| arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google