要約
組織の表現型解析は、解剖病理学における組織病理学的バイオマーカーの客観的な特徴付けを学習する際の基本的な計算病理学 (CPath) タスクです。
しかし、ホールスライドイメージング (WSI) は、WSI の大規模な画像解像度と形態学的表現型の膨大な多様性が大規模なデータの注釈付けを妨げるという、複雑なコンピューター ビジョンの問題を引き起こします。
現在の取り組みでは、自然画像データセットからの転移学習、または公的に入手可能な組織病理学データセットでの自己教師あり事前トレーニングのいずれかを備えた事前トレーニング済み画像エンコーダの使用が提案されていますが、多様な組織タイプにわたって大規模に開発および評価されることはまだありません。
我々は、20の主要な組織タイプにわたる10万以上の診断用ヘマトキシリンおよびエオシン染色されたWSIからの1億以上の組織パッチを使用して事前トレーニングされた、病理用の汎用自己教師ありモデルであるUNIを導入し、さまざまなCPathにおける33の代表的なCPath臨床タスクで評価しました。
診断上の困難。
以前の最先端モデルを上回るパフォーマンスに加えて、解像度に依存しない組織分類、少数ショット クラス プロトタイプを使用したスライド分類、最大 108 種類のがんを分類する際の疾患サブタイプの一般化など、CPath の新しいモデリング機能を実証します。
OncoTree コード分類システム。
UNI は、事前トレーニング データと下流の評価の両方の観点から、CPath での大規模な教師なし表現学習を推進し、解剖病理学における診断上困難なタスクや臨床ワークフローの全範囲に一般化して移行できるデータ効率の高い AI モデルを可能にします。
要約(オリジナル)
Tissue phenotyping is a fundamental computational pathology (CPath) task in learning objective characterizations of histopathologic biomarkers in anatomic pathology. However, whole-slide imaging (WSI) poses a complex computer vision problem in which the large-scale image resolutions of WSIs and the enormous diversity of morphological phenotypes preclude large-scale data annotation. Current efforts have proposed using pretrained image encoders with either transfer learning from natural image datasets or self-supervised pretraining on publicly-available histopathology datasets, but have not been extensively developed and evaluated across diverse tissue types at scale. We introduce UNI, a general-purpose self-supervised model for pathology, pretrained using over 100 million tissue patches from over 100,000 diagnostic haematoxylin and eosin-stained WSIs across 20 major tissue types, and evaluated on 33 representative CPath clinical tasks in CPath of varying diagnostic difficulties. In addition to outperforming previous state-of-the-art models, we demonstrate new modeling capabilities in CPath such as resolution-agnostic tissue classification, slide classification using few-shot class prototypes, and disease subtyping generalization in classifying up to 108 cancer types in the OncoTree code classification system. UNI advances unsupervised representation learning at scale in CPath in terms of both pretraining data and downstream evaluation, enabling data-efficient AI models that can generalize and transfer to a gamut of diagnostically-challenging tasks and clinical workflows in anatomic pathology.
arxiv情報
著者 | Richard J. Chen,Tong Ding,Ming Y. Lu,Drew F. K. Williamson,Guillaume Jaume,Bowen Chen,Andrew Zhang,Daniel Shao,Andrew H. Song,Muhammad Shaban,Mane Williams,Anurag Vaidya,Sharifa Sahai,Lukas Oldenburg,Luca L. Weishaupt,Judy J. Wang,Walt Williams,Long Phi Le,Georg Gerber,Faisal Mahmood |
発行日 | 2023-08-29 17:52:10+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google