MedSegDiff: Medical Image Segmentation with Diffusion Probabilistic Model

要約

拡散確率モデル(Diffusion probabilistic model, DPM)は、近年、コンピュータビジョンにおける最もホットな話題の一つとなっている。Imagen、Latent Diffusion Models、Stable Diffusionなどの画像生成アプリケーションは印象的な生成能力を示し、コミュニティで幅広い議論を呼び起こすことになった。また、最近の多くの研究では、画像のデブラーリング、超解像、異常検出など、他の多くのビジョンタスクにおいても有用であることが判明しています。DPMの成功に触発され、我々は一般的な医療画像分割タスクに向けた最初のDPMに基づくモデルを提案し、MedSegDiffと名付けた。医用画像セグメンテーションのためのDPMにおける段階的な領域注意を強化するために、我々は動的条件付き符号化を提案し、各サンプリングステップの状態適応的な条件を確立する。さらに、このプロセスにおける高周波ノイズ成分の悪影響を排除するために、Feature Frequency Parser (FF-Parser)を提案する。我々はMedSegDiffを、眼底画像における視神経杯のセグメンテーション、MRI画像における脳腫瘍のセグメンテーション、超音波画像における甲状腺結節のセグメンテーションという異なる画像モダリティを持つ3つのタスクにおいて検証した。実験結果より、MedSegDiffは最新のSOTA手法を性能差をもって上回り、提案モデルの汎用性と有効性を示すことができた。

要約(オリジナル)

Diffusion probabilistic model (DPM) recently becomes one of the hottest topic in computer vision. Its image generation application such as Imagen, Latent Diffusion Models and Stable Diffusion have shown impressive generation capabilities, which aroused extensive discussion in the community. Many recent studies also found it useful in many other vision tasks, like image deblurring, super-resolution and anomaly detection. Inspired by the success of DPM, we propose the first DPM based model toward general medical image segmentation tasks, which we named MedSegDiff. In order to enhance the step-wise regional attention in DPM for the medical image segmentation, we propose dynamic conditional encoding, which establishes the state-adaptive conditions for each sampling step. We further propose Feature Frequency Parser (FF-Parser), to eliminate the negative effect of high-frequency noise component in this process. We verify MedSegDiff on three medical segmentation tasks with different image modalities, which are optic cup segmentation over fundus images, brain tumor segmentation over MRI images and thyroid nodule segmentation over ultrasound images. The experimental results show that MedSegDiff outperforms state-of-the-art (SOTA) methods with considerable performance gap, indicating the generalization and effectiveness of the proposed model.

arxiv情報

著者 Junde Wu,Huihui Fang,Yu Zhang,Yehui Yang,Yanwu Xu
発行日 2023-01-05 12:41:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク