要約
最近の研究では、拡散モデルは、生成的敵対ネットワーク(GAN)と比較した場合、優れた合成画像を生成することが示されています。
しかし、それらの出力はしばしば非決定的であり、固有のランダム性のために地上の真理に対する高い忠実度を欠いています。
この論文では、決定論的な医療イメージ翻訳のために、新しい忠実度ブラウンブリッジモデル(HIFI-BBRG)を提案します。
私たちのモデルは、2つの明確でありながら相互に有益なマッピングの2つのマッピングと再構成マッピングです。
ブラウンブリッジトレーニングプロセスは、再建マッピングにおける忠実な損失と敵対的なトレーニングによって導かれます。
これにより、翻訳された画像を元のフォームに正確に逆転させることができ、それにより、グラウンドトゥルースに高い忠実度を備えた一貫した翻訳を実現できます。
複数のデータセットでの広範な実験では、HIFI-BBRGがマルチモーダル画像翻訳とマルチイメージの超解像度の最先端の方法よりも優れていることが示されています。
要約(オリジナル)
Recent studies have shown that diffusion models produce superior synthetic images when compared to Generative Adversarial Networks (GANs). However, their outputs are often non-deterministic and lack high fidelity to the ground truth due to the inherent randomness. In this paper, we propose a novel High-fidelity Brownian bridge model (HiFi-BBrg) for deterministic medical image translations. Our model comprises two distinct yet mutually beneficial mappings: a generation mapping and a reconstruction mapping. The Brownian bridge training process is guided by the fidelity loss and adversarial training in the reconstruction mapping. This ensures that translated images can be accurately reversed to their original forms, thereby achieving consistent translations with high fidelity to the ground truth. Our extensive experiments on multiple datasets show HiFi-BBrg outperforms state-of-the-art methods in multi-modal image translation and multi-image super-resolution.
arxiv情報
著者 | Qisheng He,Nicholas Summerfield,Peiyong Wang,Carri Glide-Hurst,Ming Dong |
発行日 | 2025-03-28 15:33:28+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google