A Comprehensive Evaluation of Histopathology Foundation Models for Ovarian Cancer Subtype Classification

要約

大規模な事前学習済みトランスフォーマーは、強力なタスク固有の人工知能モデルを支えることができる一般化された基礎モデルとしてますます開発されています。
組織病理学基礎モデルは多くのタスクにわたって大きな期待を示していますが、分析は通常、特定のタスクに調整されていない任意のハイパーパラメータによって制限されてきました。
我々は、特に卵巣癌の形態学的サブタイピングにおいて、これまでで最も厳密な組織病理学基礎モデルの単一タスク検証を報告する。
3 つの ImageNet で事前トレーニングされた特徴抽出器と 14 の組織病理学基礎モデルを使用して、注意ベースの複数インスタンス学習分類器が比較されました。
このトレーニング セットは、リーズ教育病院 NHS トラストの 434 例の卵巣癌症例からの 1864 枚の全体スライド画像で構成されていました。
5 クラスの分類パフォーマンスは 5 分割相互検証を通じて評価され、これらの相互検証モデルは、Transcanadian Study および OCEAN Challenge データセットのホールドアウト テストと外部検証のためにアンサンブルされました。
最もパフォーマンスの高いモデルは H-optimus-0 基礎モデルを使用しており、テスト セットで 89%、97%、および 74% の 5 クラスのバランスの取れた精度を備えていました。
正規化と拡張により、ImageNet で事前学習された ResNet のパフォーマンスが向上しましたが、それでも 14 の基礎モデルのうち 13 のパフォーマンスが上回っていました。
下流の分類器をハイパーパラメータで調整すると、バランスの取れた精度が中央値 1.9% 向上し、多くの改善が統計的に有意になりました。
組織病理学基礎モデルは、卵巣がんのサブタイピングに明らかな利点をもたらし、計算負荷は増加しますが、分類パフォーマンスを臨床での有用性が目に見える程度まで向上させます。
このようなモデルは、困難な症例を診断する病理組織医にセカンドオピニオンを提供することができ、病理学的診断全体の精度、客観性、効率を向上させる可能性があります。

要約(オリジナル)

Large pretrained transformers are increasingly being developed as generalised foundation models which can underpin powerful task-specific artificial intelligence models. Histopathology foundation models show great promise across many tasks, but analyses have typically been limited by arbitrary hyperparameters that were not tuned to the specific task. We report the most rigorous single-task validation of histopathology foundation models to date, specifically in ovarian cancer morphological subtyping. Attention-based multiple instance learning classifiers were compared using three ImageNet-pretrained feature extractors and fourteen histopathology foundation models. The training set consisted of 1864 whole slide images from 434 ovarian carcinoma cases at Leeds Teaching Hospitals NHS Trust. Five-class classification performance was evaluated through five-fold cross-validation, and these cross-validation models were ensembled for hold-out testing and external validation on the Transcanadian Study and OCEAN Challenge datasets. The best-performing model used the H-optimus-0 foundation model, with five-class balanced accuracies of 89%, 97%, and 74% in the test sets. Normalisations and augmentations aided the performance of the ImageNet-pretrained ResNets, but these were still outperformed by 13 of the 14 foundation models. Hyperparameter tuning the downstream classifiers improved performance by a median 1.9% balanced accuracy, with many improvements being statistically significant. Histopathology foundation models offer a clear benefit to ovarian cancer subtyping, improving classification performance to a degree where clinical utility is tangible, albeit with an increased computational burden. Such models could provide a second opinion to histopathologists diagnosing challenging cases and may improve the accuracy, objectivity, and efficiency of pathological diagnoses overall.

arxiv情報

著者 Jack Breen,Katie Allen,Kieran Zucker,Lucy Godson,Nicolas M. Orsi,Nishant Ravikumar
発行日 2024-09-09 16:59:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, eess.IV パーマリンク