A Good Feature Extractor Is All You Need for Weakly Supervised Pathology Slide Classification

要約

染色の正規化は、計算病理学パイプラインにおける重要な前処理ステップであると考えられています。
私たちは、多様な病理学データセットに対する自己教師あり学習を使用して訓練された強力な特徴抽出器の出現によって動機付けられた、弱い教師によるスライド画像全体の分類という文脈でこの信念に疑問を投げかけます。
この目的を達成するために、9 つのタスク、5 つのデータセット、3 つのダウンストリーム アーキテクチャ、およびさまざまな前処理セットアップにわたる 8,000 回を超えるトレーニング実行を含む、これまでに公開されている病理特徴抽出ツールの最も包括的な評価を実行しました。
特に、染色正規化と画像拡張を省略しても、下流のスライド レベルの分類パフォーマンスが損なわれず、メモリと計算量が大幅に節約されることがわかりました。
下流の相対的なパフォーマンス比較を容易にする新しい評価指標を使用して、公的に入手可能な最良の抽出器を特定し、それらの潜在空間が染色の変動や回転などの拡張に対して著しく堅牢であることを示します。
これまでのパッチレベルのベンチマーク研究とは対照的に、私たちのアプローチは、外部検証コホートによる弱い監視下でのスライドレベルのバイオマーカー予測タスクに焦点を当てることで、臨床的関連性を強調しています。
私たちの発見は、前処理の必要性を最小限に抑え、特徴抽出器の選択に情報を提供することにより、デジタル病理学ワークフローを合理化することに役立ちます。
コードとデータは https://georg.woelflein.eu/good-features で入手できます。

要約(オリジナル)

Stain normalisation is thought to be a crucial preprocessing step in computational pathology pipelines. We question this belief in the context of weakly supervised whole slide image classification, motivated by the emergence of powerful feature extractors trained using self-supervised learning on diverse pathology datasets. To this end, we performed the most comprehensive evaluation of publicly available pathology feature extractors to date, involving more than 8,000 training runs across nine tasks, five datasets, three downstream architectures, and various preprocessing setups. Notably, we find that omitting stain normalisation and image augmentations does not compromise downstream slide-level classification performance, while incurring substantial savings in memory and compute. Using a new evaluation metric that facilitates relative downstream performance comparison, we identify the best publicly available extractors, and show that their latent spaces are remarkably robust to variations in stain and augmentations like rotation. Contrary to previous patch-level benchmarking studies, our approach emphasises clinical relevance by focusing on slide-level biomarker prediction tasks in a weakly supervised setting with external validation cohorts. Our findings stand to streamline digital pathology workflows by minimising preprocessing needs and informing the selection of feature extractors. Code and data are available at https://georg.woelflein.eu/good-features.

arxiv情報

著者 Georg Wölflein,Dyke Ferber,Asier Rabasco Meneghetti,Omar S. M. El Nahhas,Daniel Truhn,Zunamys I. Carrero,David J. Harrison,Ognjen Arandjelović,Jakob N. Kather
発行日 2024-03-05 17:56:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク