Label Cleaning Multiple Instance Learning: Refining Coarse Annotations on Single Whole-Slide Images

要約

病理標本のホールスライド画像(WSI)中の癌領域のアノテーションは、臨床診断、生物医学研究、機械学習アルゴリズムの開発において重要な役割を果たす。しかし、網羅的で正確なアノテーションを生成することは、多大な労力を必要とし、困難であり、コストがかかる。粗く近似的なアノテーションを描くことは、より簡単な作業であり、コストも低く、病理医の作業負担を軽減することができる。本論文では、デジタル病理診断において、これらの近似的なアノテーションを精緻化し、より正確なアノテーションを得るための問題を研究する。しかし,誤判定領域を明示的に特定し修正するという精緻化の問題に取り組むものは少なく,また,多くの場合,非常に多くの学習サンプルを必要とする.我々は、Label Cleaning Multiple Instance Learning (LC-MIL) と名付けた、外部学習データを必要とせず、単一のWSI上で粗いアノテーションを改良する手法を発表する。WSIから切り出された不正確なラベルを持つパッチは、複数インスタンス学習の枠組みの中で共同で処理され、予測モデルへの影響を緩和し、セグメンテーションを精緻化する。乳がんリンパ節転移、肝臓がん、大腸がんを含む異種WSIセットでの実験では、LC-MILは1枚のスライドから学習しながらも、粗いアノテーションを大幅に改良し、最先端の代替手段を凌駕することが示された。さらに、病理医が描いた実際のアノテーションが、提案するアプローチによって効率的に洗練され、改善されることを示す。これらの結果は、LC-MILが粗い注釈の病理標本から細かい注釈を提供する軽量で有望なツールであることを示している。

要約(オリジナル)

Annotating cancerous regions in whole-slide images (WSIs) of pathology samples plays a critical role in clinical diagnosis, biomedical research, and machine learning algorithms development. However, generating exhaustive and accurate annotations is labor-intensive, challenging, and costly. Drawing only coarse and approximate annotations is a much easier task, less costly, and it alleviates pathologists’ workload. In this paper, we study the problem of refining these approximate annotations in digital pathology to obtain more accurate ones. Some previous works have explored obtaining machine learning models from these inaccurate annotations, but few of them tackle the refinement problem where the mislabeled regions should be explicitly identified and corrected, and all of them require a — often very large — number of training samples. We present a method, named Label Cleaning Multiple Instance Learning (LC-MIL), to refine coarse annotations on a single WSI without the need of external training data. Patches cropped from a WSI with inaccurate labels are processed jointly within a multiple instance learning framework, mitigating their impact on the predictive model and refining the segmentation. Our experiments on a heterogeneous WSI set with breast cancer lymph node metastasis, liver cancer, and colorectal cancer samples show that LC-MIL significantly refines the coarse annotations, outperforming state-of-the-art alternatives, even while learning from a single slide. Moreover, we demonstrate how real annotations drawn by pathologists can be efficiently refined and improved by the proposed approach. All these results demonstrate that LC-MIL is a promising, light-weight tool to provide fine-grained annotations from coarsely annotated pathology sets.

arxiv情報

著者 Zhenzhen Wang,Carla Saoud,Sintawat Wangsiricharoen,Aaron W. James,Aleksander S. Popel,Jeremias Sulam
発行日 2022-06-07 22:16:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, cs.LG パーマリンク