Impact of imperfect annotations on CNN training and performance for instance segmentation and classification in digital pathology

要約

細胞核などの多数のインスタンスのセグメント化と分類は、正確な診断のためのデジタルパソロジーにおける重要なタスクです。
ただし、アノテーション プロセスの複雑さにより、ディープ ラーニング手法に使用できる高品質のデータセットが制限されることがよくあります。
この研究では、病理組織画像内の核の検出、セグメント化、分類という複合タスクのための最先端の CNN モデルのトレーニングとパフォーマンスに対するノイズの多いアノテーションの影響を調査します。
これに関連して、トレーニング中のアノテーション ノイズへの過剰適合を防ぐために適切なトレーニング エポック数を決定するための条件を調査します。
私たちの結果は、正しくアノテーションが付けられた小規模な検証セットの利用が、過剰適合を回避し、モデルのパフォーマンスを大幅に維持するのに役立つことを示しています。
さらに、私たちの調査結果は、事前トレーニングの有益な役割を強調しています。

要約(オリジナル)

Segmentation and classification of large numbers of instances, such as cell nuclei, are crucial tasks in digital pathology for accurate diagnosis. However, the availability of high-quality datasets for deep learning methods is often limited due to the complexity of the annotation process. In this work, we investigate the impact of noisy annotations on the training and performance of a state-of-the-art CNN model for the combined task of detecting, segmenting and classifying nuclei in histopathology images. In this context, we investigate the conditions for determining an appropriate number of training epochs to prevent overfitting to annotation noise during training. Our results indicate that the utilisation of a small, correctly annotated validation set is instrumental in avoiding overfitting and maintaining model performance to a large extent. Additionally, our findings underscore the beneficial role of pre-training.

arxiv情報

著者 Laura Gálvez Jiménez,Christine Decaestecker
発行日 2024-10-18 10:51:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク