Conditional Diffusion Models for Weakly Supervised Medical Image Segmentation

要約

ノイズ除去拡散確率モデルの最近の進歩は、画像合成タスクにおいて大きな成功を収めています。
画像セマンティック セグメンテーションにおけるこの強力なツールの可能性を探る研究はすでに行われていますが、弱教師セマンティック セグメンテーション (WSSS) への応用は比較的研究が進んでいません。
条件付き拡散モデル (CDM) が特定の分布に従って画像を生成できることを観察し、この研究では、CDM の基礎となるカテゴリを意識した意味情報を利用して、画像レベルの注釈のみでターゲット オブジェクトの予測マスクを取得します。
より具体的には、入力条件に対する CDM の出力の導関数を近似することによって、目的のクラスを特定します。
私たちの方法は、再構成プロセス中にバックグラウンドでノイズを蓄積する外部分類器からのガイダンスを伴う以前の拡散モデル方法とは異なります。
私たちの手法は、2 つの公開医療画像セグメンテーション データセットに対して最先端の CAM および拡散モデル手法を上回っており、CDM が WSSS の有望なツールであることを示しています。
また、実験では、私たちの方法が既存の拡散モデル方法よりも時間効率が高く、より幅広い用途に実用的であることが示されています。

要約(オリジナル)

Recent advances in denoising diffusion probabilistic models have shown great success in image synthesis tasks. While there are already works exploring the potential of this powerful tool in image semantic segmentation, its application in weakly supervised semantic segmentation (WSSS) remains relatively under-explored. Observing that conditional diffusion models (CDM) is capable of generating images subject to specific distributions, in this work, we utilize category-aware semantic information underlied in CDM to get the prediction mask of the target object with only image-level annotations. More specifically, we locate the desired class by approximating the derivative of the output of CDM w.r.t the input condition. Our method is different from previous diffusion model methods with guidance from an external classifier, which accumulates noises in the background during the reconstruction process. Our method outperforms state-of-the-art CAM and diffusion model methods on two public medical image segmentation datasets, which demonstrates that CDM is a promising tool in WSSS. Also, experiment shows our method is more time-efficient than existing diffusion model methods, making it practical for wider applications.

arxiv情報

著者 Xinrong Hu,Yu-Jen Chen,Tsung-Yi Ho,Yiyu Shi
発行日 2023-06-06 17:29:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク