A Good Feature Extractor Is All You Need for Weakly Supervised Learning in Histopathology

要約

ディープラーニングは病理学に革命をもたらし、疾患の予後と個別化された治療における新たな機会を提供します。
歴史的に、染色の正規化は計算病理学パイプラインにおける重要な前処理ステップであり、深層学習の時代まで続いています。
しかし、さまざまな病理学データセットに対して自己教師あり学習 (SSL) を使用してトレーニングされた特徴抽出器の出現により、この慣行に疑問が生じています。
公的に入手可能な特徴抽出器の経験的評価では、染色正規化と画像拡張を省略しても、メモリとコンピューティングを大幅に節約しながら、ダウンストリームのパフォーマンスを損なうことがないことがわかりました。
さらに、最高のパフォーマンスを誇る特徴抽出器は、潜在空間での回転などの染色や拡張の変化に対して非常に堅牢であることを示します。
これまでのパッチレベルのベンチマーク研究とは対照的に、私たちのアプローチは、外部検証コホートによる弱い監視下でのスライドレベルの予測タスクに焦点を当てることで、臨床的関連性を強調しています。
この研究は、これまでの公的病理 SSL 特徴抽出器の最も包括的な堅牢性評価を表しており、9 つのタスク、5 つのデータセット、3 つのダウンストリーム アーキテクチャ、およびさまざまな前処理セットアップにわたる 6,000 回を超えるトレーニングの実行が含まれています。
私たちの発見は、前処理の必要性を最小限に抑え、特徴抽出器の選択に情報を提供することにより、デジタル病理学ワークフローを合理化することに役立ちます。

要約(オリジナル)

Deep learning is revolutionising pathology, offering novel opportunities in disease prognosis and personalised treatment. Historically, stain normalisation has been a crucial preprocessing step in computational pathology pipelines, and persists into the deep learning era. Yet, with the emergence of feature extractors trained using self-supervised learning (SSL) on diverse pathology datasets, we call this practice into question. In an empirical evaluation of publicly available feature extractors, we find that omitting stain normalisation and image augmentations does not compromise downstream performance, while incurring substantial savings in memory and compute. Further, we show that the top-performing feature extractors are remarkably robust to variations in stain and augmentations like rotation in their latent space. Contrary to previous patch-level benchmarking studies, our approach emphasises clinical relevance by focusing on slide-level prediction tasks in a weakly supervised setting with external validation cohorts. This work represents the most comprehensive robustness evaluation of public pathology SSL feature extractors to date, involving more than 6,000 training runs across nine tasks, five datasets, three downstream architectures, and various preprocessing setups. Our findings stand to streamline digital pathology workflows by minimising preprocessing needs and informing the selection of feature extractors.

arxiv情報

著者 Georg Wölflein,Dyke Ferber,Asier Rabasco Meneghetti,Omar S. M. El Nahhas,Daniel Truhn,Zunamys I. Carrero,David J. Harrison,Ognjen Arandjelović,Jakob N. Kather
発行日 2023-11-22 17:06:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク