Diffusion Based Ambiguous Image Segmentation

要約

医療画像のセグメンテーションには、多くの場合、専門家の注釈の変動による固有の不確実性が含まれます。
この不確実性をキャプチャすることは重要な目標であり、以前の作品は、もっともらしい専門家の基本真理の完全な分布を表す目的で、さまざまな生成画像モデルを使用しています。
この作業では、生成セグメンテーションのための拡散モデルの設計スペースを探り、ノイズスケジュール、予測タイプ、および損失の重みの影響を調査します。
特に、入力スケーリングによりノイズスケジュールを難しくすると、パフォーマンスが大幅に向上することがわかります。
拡散プロセスが離散セグメンテーションドメインにあるため、XおよびV予測はエプシロン予測よりも優れていると結論付けます。
多くの損失の重み付けは、拡散プロセスの終わりに十分な重みを与える限り、同様の性能を達成します。
LIDC-Idri肺病変データセットに基づいて実験を行い、最先端の(SOTA)パフォーマンスを取得します。
さらに、画像セグメンテーションの不確実性により適したLIDC-IDRIデータセットのランダムにトリミングされたバリアントを紹介します。
私たちのモデルは、この難しい設定でもSOTAを達成します。

要約(オリジナル)

Medical image segmentation often involves inherent uncertainty due to variations in expert annotations. Capturing this uncertainty is an important goal and previous works have used various generative image models for the purpose of representing the full distribution of plausible expert ground truths. In this work, we explore the design space of diffusion models for generative segmentation, investigating the impact of noise schedules, prediction types, and loss weightings. Notably, we find that making the noise schedule harder with input scaling significantly improves performance. We conclude that x- and v-prediction outperform epsilon-prediction, likely because the diffusion process is in the discrete segmentation domain. Many loss weightings achieve similar performance as long as they give enough weight to the end of the diffusion process. We base our experiments on the LIDC-IDRI lung lesion dataset and obtain state-of-the-art (SOTA) performance. Additionally, we introduce a randomly cropped variant of the LIDC-IDRI dataset that is better suited for uncertainty in image segmentation. Our model also achieves SOTA in this harder setting.

arxiv情報

著者 Jakob Lønborg Christensen,Morten Rieger Hannemose,Anders Bjorholm Dahl,Vedrana Andersen Dahl
発行日 2025-04-08 12:33:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク