要約
高解像度の病理学的画像に固有の複雑さと変動性は、計算病理学に重要な課題をもたらします。
AIを活用する病理財団モデルは、変革的進歩を触媒していますが、その開発には大規模なデータセット、かなりのストレージ容量、および実質的な計算リソースが必要です。
さらに、臨床的適用性と一般化可能性を確保するには、幅広い臨床タスクにわたる厳密な検証が必要です。
ここでは、複数の中心にわたって20の組織および臓器タイプからの300Kの病理学的スライドを含むデータセットで自己監視学習を介して訓練された多用途の病理学の基礎モデルであるPathorchestraを提示します。
このモデルは、61のプライベートデータセットと51のパブリックデータセットの組み合わせを使用して、112の臨床タスクで厳密に評価されました。
これらのタスクには、デジタルスライド前処理、汎癌分類、病変の識別、マルチキャンサーサブタイプ分類、バイオマーカー評価、遺伝子発現予測、および構造化されたレポートの生成が含まれます。
Pathorchestraは、27,755 WSIと9,415,729のROIにわたって並外れたパフォーマンスを実証し、47のタスクで0.950を超える精度を達成しました。
特に、これは、高中症の結腸直腸癌と診断的に複雑なリンパ腫エリアの構造化された報告を生成した最初のモデルであり、基礎モデルではめったに対処されていないが、計り知れない臨床的潜在能力を持っています。
全体として、Pathorchestraは、広範な臨床グレードのタスクにわたって検証された、大規模で自己監視された病理財団モデルの実現可能性と有効性を例示しています。
その高精度と広範なデータアノテーションへの依存度の低下は、臨床統合の可能性を強調しており、より効率的で高品質の医療サービスへの経路を提供します。
要約(オリジナル)
The complexity and variability inherent in high-resolution pathological images present significant challenges in computational pathology. While pathology foundation models leveraging AI have catalyzed transformative advancements, their development demands large-scale datasets, considerable storage capacity, and substantial computational resources. Furthermore, ensuring their clinical applicability and generalizability requires rigorous validation across a broad spectrum of clinical tasks. Here, we present PathOrchestra, a versatile pathology foundation model trained via self-supervised learning on a dataset comprising 300K pathological slides from 20 tissue and organ types across multiple centers. The model was rigorously evaluated on 112 clinical tasks using a combination of 61 private and 51 public datasets. These tasks encompass digital slide preprocessing, pan-cancer classification, lesion identification, multi-cancer subtype classification, biomarker assessment, gene expression prediction, and the generation of structured reports. PathOrchestra demonstrated exceptional performance across 27,755 WSIs and 9,415,729 ROIs, achieving over 0.950 accuracy in 47 tasks, including pan-cancer classification across various organs, lymphoma subtype diagnosis, and bladder cancer screening. Notably, it is the first model to generate structured reports for high-incidence colorectal cancer and diagnostically complex lymphoma-areas that are infrequently addressed by foundational models but hold immense clinical potential. Overall, PathOrchestra exemplifies the feasibility and efficacy of a large-scale, self-supervised pathology foundation model, validated across a broad range of clinical-grade tasks. Its high accuracy and reduced reliance on extensive data annotation underline its potential for clinical integration, offering a pathway toward more efficient and high-quality medical services.
arxiv情報
著者 | Fang Yan,Jianfeng Wu,Jiawen Li,Wei Wang,Jiaxuan Lu,Wen Chen,Zizhao Gao,Jianan Li,Hong Yan,Jiabo Ma,Minda Chen,Yang Lu,Qing Chen,Yizhi Wang,Xitong Ling,Xuenian Wang,Zihan Wang,Qiang Huang,Shengyi Hua,Mianxin Liu,Lei Ma,Tian Shen,Xiaofan Zhang,Yonghong He,Hao Chen,Shaoting Zhang,Zhe Wang |
発行日 | 2025-03-31 17:28:02+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google