Calibrating the Dice loss to handle neural network overconfidence for biomedical image segmentation

要約

ダイス類似度係数 (DSC) は、クラスの不均衡に対する堅牢性により、生物医学画像セグメンテーションに広く使用されているメトリックと損失関数の両方です。
ただし、DSC 損失が十分に調整されていないことはよく知られており、その結果、生物医学および臨床の実践で有用に解釈できない過信した予測が生じます。
多くの場合、パフォーマンスは、ディープ ニューラル ネットワークによって生成されたセグメンテーションを評価するために使用される唯一のメトリックであり、キャリブレーションはしばしば無視されます。
ただし、キャリブレーションは生物医学および臨床診療への変換にとって重要であり、科学者や臨床医による解釈のためのモデル予測に重要なコンテキスト情報を提供します。
この研究では、DSC ++損失と呼ばれるDSC損失のシンプルで効果的な拡張を提供します。これは、自信過剰で不正確な予測に関連するペナルティを選択的に調整します。
スタンドアロンの損失関数として、DSC++ 損失は、2D バイナリと 3D マルチクラス セグメンテーション タスクの両方を含む、十分に検証された 6 つのオープンソース生物医学画像データセット全体で、従来の DSC 損失よりも大幅に改善されたキャリブレーションを実現します。
同様に、DSC++ 損失を 4 つの DSC ベースの損失関数に統合すると、大幅に改善されたキャリブレーションが観察されます。
最後に、softmax のしきい値処理を使用して、十分に調整された出力が再現精度バイアスの調整を可能にすることを示します。これは、モデル予測を生物医学または臨床タスクに適合させるための重要な後処理手法です。
DSC++ 損失は、DSC 損失の主要な制限を克服し、生物医学および臨床診療で使用するディープ ラーニング セグメンテーション モデルのトレーニングに適した損失関数を提供します。
ソース コードは https://github.com/mlyg/DicePlusPlus で入手できます。

要約(オリジナル)

The Dice similarity coefficient (DSC) is both a widely used metric and loss function for biomedical image segmentation due to its robustness to class imbalance. However, it is well known that the DSC loss is poorly calibrated, resulting in overconfident predictions that cannot be usefully interpreted in biomedical and clinical practice. Performance is often the only metric used to evaluate segmentations produced by deep neural networks, and calibration is often neglected. However, calibration is important for translation into biomedical and clinical practice, providing crucial contextual information to model predictions for interpretation by scientists and clinicians. In this study, we provide a simple yet effective extension of the DSC loss, named the DSC++ loss, that selectively modulates the penalty associated with overconfident, incorrect predictions. As a standalone loss function, the DSC++ loss achieves significantly improved calibration over the conventional DSC loss across six well-validated open-source biomedical imaging datasets, including both 2D binary and 3D multi-class segmentation tasks. Similarly, we observe significantly improved calibration when integrating the DSC++ loss into four DSC-based loss functions. Finally, we use softmax thresholding to illustrate that well calibrated outputs enable tailoring of recall-precision bias, which is an important post-processing technique to adapt the model predictions to suit the biomedical or clinical task. The DSC++ loss overcomes the major limitation of the DSC loss, providing a suitable loss function for training deep learning segmentation models for use in biomedical and clinical practice. Source code is available at: https://github.com/mlyg/DicePlusPlus.

arxiv情報

著者 Michael Yeung,Leonardo Rundo,Yang Nan,Evis Sala,Carola-Bibiane Schönlieb,Guang Yang
発行日 2022-11-01 09:26:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, eess.IV, math.OC パーマリンク