Fully transformer-based biomarker prediction from colorectal cancer histology: a large-scale multicentric study

要約

背景: ディープ ラーニング (DL) は、結腸直腸癌の通常の病理スライドから予測および予後バイオ マーカーを抽出できます。
たとえば、CRC におけるマイクロサテライト不安定性 (MSI) の診断のための DL テストは、2022 年に承認されました。現在のアプローチは、畳み込みニューラル ネットワーク (CNN) に依存しています。
Transformer ネットワークは CNN よりも優れており、多くのアプリケーションで CNN に取って代わりつつありますが、大規模ながんのバイオマーカー予測には使用されていません。
さらに、ほとんどの DL アプローチは小規模な患者コホートで訓練されているため、臨床的有用性が制限されています。
方法: この研究では、病理スライドからのエンド ツー エンドのバイオ マーカー予測のための新しい完全にトランスフォーマー ベースのパイプラインを開発しました。
事前にトレーニングされたトランスフォーマー エンコーダーとパッチ アグリゲーション用のトランスフォーマー ネットワークを組み合わせて、患者レベルで単一および複数ターゲットの予測を行うことができます。
当社は、10 の結腸直腸がんコホートからの 9,000 人を超える患者でパイプラインをトレーニングしています。
結果: 完全な変換ベースのアプローチにより、現在の最先端のアルゴリズムと比較して、パフォーマンス、一般化可能性、データ効率、および解釈可能性が大幅に向上します。
大規模な多施設コホートでトレーニングした後、外科的切除標本の MSI 予測で 0.99 の負の予測値で 0.97 の感度を達成しました。
切除標本のみのトレーニングが内視鏡生検組織で臨床グレードのパフォーマンスに達し、長年の診断上の問題を解決することを初めて実証します。
解釈: 何千もの病理スライドでトレーニングされた完全なトランスフォーマー ベースのエンド ツー エンド パイプラインは、外科的切除および生検のバイオマーカー予測に臨床グレードのパフォーマンスをもたらします。
私たちの新しいメソッドは、オープン ソース ライセンスの下で自由に利用できます。

要約(オリジナル)

Background: Deep learning (DL) can extract predictive and prognostic biomarkers from routine pathology slides in colorectal cancer. For example, a DL test for the diagnosis of microsatellite instability (MSI) in CRC has been approved in 2022. Current approaches rely on convolutional neural networks (CNNs). Transformer networks are outperforming CNNs and are replacing them in many applications, but have not been used for biomarker prediction in cancer at a large scale. In addition, most DL approaches have been trained on small patient cohorts, which limits their clinical utility. Methods: In this study, we developed a new fully transformer-based pipeline for end-to-end biomarker prediction from pathology slides. We combine a pre-trained transformer encoder and a transformer network for patch aggregation, capable of yielding single and multi-target prediction at patient level. We train our pipeline on over 9,000 patients from 10 colorectal cancer cohorts. Results: A fully transformer-based approach massively improves the performance, generalizability, data efficiency, and interpretability as compared with current state-of-the-art algorithms. After training on a large multicenter cohort, we achieve a sensitivity of 0.97 with a negative predictive value of 0.99 for MSI prediction on surgical resection specimens. We demonstrate for the first time that resection specimen-only training reaches clinical-grade performance on endoscopic biopsy tissue, solving a long-standing diagnostic problem. Interpretation: A fully transformer-based end-to-end pipeline trained on thousands of pathology slides yields clinical-grade performance for biomarker prediction on surgical resections and biopsies. Our new methods are freely available under an open source license.

arxiv情報

著者 Sophia J. Wagner,Daniel Reisenbüchler,Nicholas P. West,Jan Moritz Niehues,Gregory Patrick Veldhuizen,Philip Quirke,Heike I. Grabsch,Piet A. van den Brandt,Gordon G. A. Hutchins,Susan D. Richman,Tanwei Yuan,Rupert Langer,Josien Christina Anna Jenniskens,Kelly Offermans,Wolfram Mueller,Richard Gray,Stephen B. Gruber,Joel K. Greenson,Gad Rennert,Joseph D. Bonner,Daniel Schmolze,Jacqueline A. James,Maurice B. Loughrey,Manuel Salto-Tellez,Hermann Brenner,Michael Hoffmeister,Daniel Truhn,Julia A. Schnabel,Melanie Boxberg,Tingying Peng,Jakob Nikolas Kather
発行日 2023-01-23 18:33:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク