Theoretical analysis and experimental validation of volume bias of soft Dice optimized segmentation maps in the context of inherent uncertainty

要約

臨床的な関心事は、しばしば構造物の体積を測定することであり、それは一般的にセグメンテーションから導かれる。セグメンテーション法の評価と比較のために、セグメンテーションと事前に定義されたグランドトゥルースとの間の類似性は、Dice スコアのような一般的な離散メトリックを使用して測定される。最近のセグメンテーション手法では、学習段階において、ソフトダイスのような微分可能な代理指標を損失関数の一部として用いている。本研究では、まず、潜在的に不確実または曖昧なセグメンテーションからボリューム推定値を導出する方法について簡単に説明する。続いて、CNNの学習に用いられる一般的な損失関数であるクロスエントロピーとソフトダイスに、内在する不確実性を関連付ける理論解析と実験検証を行う。我々は、ソフトダイス最適化がダイススコアや他の指標に関して性能の向上をもたらすにもかかわらず、固有の不確実性が高いタスクに対してボリュームバイアスをもたらす可能性があることを見出した。これらの知見は、本手法の臨床的限界を示すものであり、オプションの再キャリブレーションステップを用いて、より緊密なアドホックボリューム分析を行うことを示唆するものである。

要約(オリジナル)

The clinical interest is often to measure the volume of a structure, which is typically derived from a segmentation. In order to evaluate and compare segmentation methods, the similarity between a segmentation and a predefined ground truth is measured using popular discrete metrics, such as the Dice score. Recent segmentation methods use a differentiable surrogate metric, such as soft Dice, as part of the loss function during the learning phase. In this work, we first briefly describe how to derive volume estimates from a segmentation that is, potentially, inherently uncertain or ambiguous. This is followed by a theoretical analysis and an experimental validation linking the inherent uncertainty to common loss functions for training CNNs, namely cross-entropy and soft Dice. We find that, even though soft Dice optimization leads to an improved performance with respect to the Dice score and other measures, it may introduce a volume bias for tasks with high inherent uncertainty. These findings indicate some of the method’s clinical limitations and suggest doing a closer ad-hoc volume analysis with an optional re-calibration step.

arxiv情報

著者 Jeroen Bertels,David Robben,Dirk Vandermeulen,Paul Suetens
発行日 2022-11-08 11:04:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.CV, cs.LG パーマリンク