Self-Supervision Enhances Instance-based Multiple Instance Learning Methods in Digital Pathology: A Benchmark Study

要約

複数インスタンス学習(Multiple Instance Learning: MIL)は、全スライド画像(Whole Slide Image: WSI)の分類に最適なソリューションとして登場した。MILは各スライドをパッチに分割し、グローバルラベルでラベル付けされたインスタンスのバッグとして扱う。MILには、インスタンスベースと埋め込みベースの2つのアプローチがある。前者では、各パッチは独立して分類され、次にパッチスコアがバッグラベルを予測するために集約される。後者では、パッチ埋め込みを集約した後にバッグ分類が行われる。たとえインスタンスベースの手法がより解釈しやすいものであったとしても、埋め込みベースのMILは劣悪な特徴抽出器に対して頑健であるため、これまでは通常好まれてきた。しかし近年、SSL(Self-Supervised Learning:自己教師あり学習)を用いることで、特徴埋込の品質は飛躍的に向上している。それにもかかわらず、多くの著者は埋め込みベースのMILの優位性を支持し続けている。これをさらに調査するために、我々は4つのデータセットで710の実験を行い、10のMIL戦略、4つのバックボーンを持つ6つの自己教師付き手法、4つの基礎モデル、様々な病理学に適応した手法を比較する。さらに、病理学領域でこれまで使用されたことのないインスタンスベースのMIL手法を4つ紹介する。これらの広範な実験を通して、優れたSSL特徴抽出器を用いれば、非常に少ないパラメータで、単純なインスタンスベースのMILが、複雑な最先端の(SOTA)埋め込みベースのMIL手法と同等以上の性能を得ることを示し、BRACSとCamelyon16データセットで新たなSOTA結果を設定した。単純なインスタンスベースのMIL法は、当然ながら臨床医にとってより解釈しやすく説明しやすいので、我々の結果は、複雑な埋め込みベースのMIL法よりも、WSIによく適応したSSL法にもっと力を入れるべきであることを示唆している。

要約(オリジナル)

Multiple Instance Learning (MIL) has emerged as the best solution for Whole Slide Image (WSI) classification. It consists of dividing each slide into patches, which are treated as a bag of instances labeled with a global label. MIL includes two main approaches: instance-based and embedding-based. In the former, each patch is classified independently, and then the patch scores are aggregated to predict the bag label. In the latter, bag classification is performed after aggregating patch embeddings. Even if instance-based methods are naturally more interpretable, embedding-based MILs have usually been preferred in the past due to their robustness to poor feature extractors. However, recently, the quality of feature embeddings has drastically increased using self-supervised learning (SSL). Nevertheless, many authors continue to endorse the superiority of embedding-based MIL. To investigate this further, we conduct 710 experiments across 4 datasets, comparing 10 MIL strategies, 6 self-supervised methods with 4 backbones, 4 foundation models, and various pathology-adapted techniques. Furthermore, we introduce 4 instance-based MIL methods never used before in the pathology domain. Through these extensive experiments, we show that with a good SSL feature extractor, simple instance-based MILs, with very few parameters, obtain similar or better performance than complex, state-of-the-art (SOTA) embedding-based MIL methods, setting new SOTA results on the BRACS and Camelyon16 datasets. Since simple instance-based MIL methods are naturally more interpretable and explainable to clinicians, our results suggest that more effort should be put into well-adapted SSL methods for WSI rather than into complex embedding-based MIL methods.

arxiv情報

著者 Ali Mammadov,Loic Le Folgoc,Julien Adam,Anne Buronfosse,Gilles Hayem,Guillaume Hocquet,Pietro Gori
発行日 2025-05-02 08:43:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.CV パーマリンク