Calibrate the inter-observer segmentation uncertainty via diagnosis-first principle

要約

医療画像では、組織や病変があいまいな場合が多い。そのため、医療画像のセグメンテーションは、個人的なバイアスを軽減するために、通常、臨床専門家のグループによってアノテーションされる。しかし、このような臨床的なルーチンは、機械学習アルゴリズムの適用に新たな課題をもたらせる。明確なグランドトゥルースがなければ、ディープラーニングモデルの学習と評価は困難であろう。アノテーションが異なる採点者から収集される場合、一般的な選択肢は多数決である。しかし、このような戦略は評定者の専門性の違いを無視する。本論文では、較正された観察者間の不確実性を持つセグメンテーションを予測するタスクを考える。我々は、臨床の場において、医用画像のセグメンテーションは通常、病気の診断を補助するために用いられることに着目した。この観察に触発され、我々は診断優先の原則を提案する。すなわち、疾患診断を基準として、観察者間のセグメンテーションの不確実性を較正するのである。具体的には、DiFFはまず、多人数によるセグメンテーションラベルを単一のグランドトゥルースに融合することを学習し、これにより疾患診断性能を最大化する。そして、DF-GTを生画像からセグメンテーションするために、Take and Giveモデルを提案する。我々は、DiFFの有効性を3種類の医療用セグメンテーションタスクで検証した。すなわち、眼底画像における眼底像のセグメンテーション、超音波画像における甲状腺結節のセグメンテーション、皮膚鏡画像における皮膚病変のセグメンテーションである。実験の結果、提案するDiFFは、対応する疾患診断を大幅に促進することができ、これまでの最先端多人数学習法を凌駕することが示された。

要約(オリジナル)

On the medical images, many of the tissues/lesions may be ambiguous. That is why the medical segmentation is typically annotated by a group of clinical experts to mitigate the personal bias. However, this clinical routine also brings new challenges to the application of machine learning algorithms. Without a definite ground-truth, it will be difficult to train and evaluate the deep learning models. When the annotations are collected from different graders, a common choice is majority vote. However such a strategy ignores the difference between the grader expertness. In this paper, we consider the task of predicting the segmentation with the calibrated inter-observer uncertainty. We note that in clinical practice, the medical image segmentation is usually used to assist the disease diagnosis. Inspired by this observation, we propose diagnosis-first principle, which is to take disease diagnosis as the criterion to calibrate the inter-observer segmentation uncertainty. Following this idea, a framework named Diagnosis First segmentation Framework (DiFF) is proposed to estimate diagnosis-first segmentation from the raw images.Specifically, DiFF will first learn to fuse the multi-rater segmentation labels to a single ground-truth which could maximize the disease diagnosis performance. We dubbed the fused ground-truth as Diagnosis First Ground-truth (DF-GT).Then, we further propose Take and Give Modelto segment DF-GT from the raw image. We verify the effectiveness of DiFF on three different medical segmentation tasks: OD/OC segmentation on fundus images, thyroid nodule segmentation on ultrasound images, and skin lesion segmentation on dermoscopic images. Experimental results show that the proposed DiFF is able to significantly facilitate the corresponding disease diagnosis, which outperforms previous state-of-the-art multi-rater learning methods.

arxiv情報

著者 Junde Wu,Huihui Fang,Hoayi Xiong,Lixin Duan,Mingkui Tan,Weihua Yang,Huiying Liu,Yanwu Xu
発行日 2022-08-05 07:12:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, eess.IV パーマリンク