Screen Them All: High-Throughput Pan-Cancer Genetic and Phenotypic Biomarker Screening from H&E Whole Slide Images

要約

多くの分子変化は臨床予後または治療予測バイオマーカーとして機能し、通常は単一または複数遺伝子の分子アッセイを使用して検出されます。
ただし、これらのアッセイは高価で、組織を破壊するため、完了までに数週間かかることがよくあります。
日常的な H&E WSI で AI を使用すると、複数の分子バイオマーカーをスクリーニングするための迅速かつ経済的なアプローチが提供されます。
我々は、300 万枚のスライドで事前トレーニングされた基礎モデルである Virchow2 を活用し、47,960 枚のスキャンされたヘマトキシリンおよびエオシン (H&E) を使用して、次世代シーケンシング (NGS) アッセイによって以前に決定されたゲノムの特徴を調査する、ハイスループットの AI ベースのシステムを紹介します。
38,984 人のがん患者の全スライド画像 (WSI)。
バイオマーカーまたは癌の種類ごとに個別のモデルをトレーニングする従来の方法とは異なり、当社のシステムは統合モデルを採用して、癌の種類全体で臨床的に関連する広範囲の分子バイオマーカーを同時に予測します。
MSK-IMPACT を対象とした 505 遺伝子のバイオマーカー パネルを再現するようにネットワークをトレーニングすることにより、最も一般的な 15 種類のがんにおいて平均 AU-ROC が 0.89 の高性能バイオマーカー 80 個を特定しました。
さらに、40 のバイオマーカーが特定のがんの組織学的サブタイプとの強い関連性を示しました。
さらに、58 のバイオマーカーは、治療法の選択と反応予測のために臨床的に頻繁に分析される標的と関連していました。
このモデルは、5 つの標準シグナル伝達経路の活性を予測し、DNA 修復機構の欠陥を特定し、腫瘍突然変異負荷、マイクロサテライト不安定性 (MSI)、および染色体不安定性 (CIN) によって測定されるゲノム不安定性を予測することもできます。
提案されたモデルは、治療法の選択を導き、治療効果を改善し、臨床試験のための患者のスクリーニングを加速し、新しい治療標的の検討を引き起こす可能性を提供します。

要約(オリジナル)

Many molecular alterations serve as clinically prognostic or therapy-predictive biomarkers, typically detected using single or multi-gene molecular assays. However, these assays are expensive, tissue destructive and often take weeks to complete. Using AI on routine H&E WSIs offers a fast and economical approach to screen for multiple molecular biomarkers. We present a high-throughput AI-based system leveraging Virchow2, a foundation model pre-trained on 3 million slides, to interrogate genomic features previously determined by an next-generation sequencing (NGS) assay, using 47,960 scanned hematoxylin and eosin (H&E) whole slide images (WSIs) from 38,984 cancer patients. Unlike traditional methods that train individual models for each biomarker or cancer type, our system employs a unified model to simultaneously predict a wide range of clinically relevant molecular biomarkers across cancer types. By training the network to replicate the MSK-IMPACT targeted biomarker panel of 505 genes, it identified 80 high performing biomarkers with a mean AU-ROC of 0.89 in 15 most common cancer types. In addition, 40 biomarkers demonstrated strong associations with specific cancer histologic subtypes. Furthermore, 58 biomarkers were associated with targets frequently assayed clinically for therapy selection and response prediction. The model can also predict the activity of five canonical signaling pathways, identify defects in DNA repair mechanisms, and predict genomic instability measured by tumor mutation burden, microsatellite instability (MSI), and chromosomal instability (CIN). The proposed model can offer potential to guide therapy selection, improve treatment efficacy, accelerate patient screening for clinical trials and provoke the interrogation of new therapeutic targets.

arxiv情報

著者 Yi Kan Wang,Ludmila Tydlitatova,Jeremy D. Kunz,Gerard Oakley,Ran A. Godrich,Matthew C. H. Lee,Chad Vanderbilt,Razik Yousfi,Thomas Fuchs,David S. Klimstra,Siqi Liu
発行日 2024-08-20 12:47:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV, q-bio.QM パーマリンク