CanvOI, an Oncology Intelligence Foundation Model: Scaling FLOPS Differently

要約

急速に進化するデジタル腫瘍病理学の分野は、入手可能なラベル付きデータが限られていて、稀な症状を伴うことが多い、多様で複雑な臨床的疑問に対処する必要性など、重大な課題に直面しています。
これらの制限は、確率的決定の精度が最も重要である生物医学分野における堅牢な AI 駆動ツールの開発を妨げています。
これに対処するために、デジタル病理学基盤モデルが登場し始めており、通常は事前トレーニング データセットとモデル パラメーターのサイズと多様性を念頭に置いて開発されています。
ここでは、別のアプローチを通じてこれらの課題に対処することでデジタルパソロジーの機能を強化するように設計された、ViT-g/10 ベースの基盤モデルである CanvOI を紹介します。
腫瘍の組織病理学的画像の独特な性質と、マルチインスタンス学習 (MIL) 下流モデルに意味のある表現を提供するための埋め込みからの要件を考慮して、入力画像の特性を変更することを選択しました。
より大きなタイル サイズ (380 x 380 ピクセル) とより小さなパッチ サイズ (10 x 10 ピクセル) を導入することで、モデルのパフォーマンスを最適化し、計算リソースを新しい方向に推し進め、がんに対する最先端のパフォーマンスを達成することができました。
関連のベンチマーク。
CanvOI は、デジタルパソロジー用に構築された他の主要な基盤モデルと比較して、平均 AUC が 1.5 ~ 7.4% 向上することを実証しました。
さらに、私たちの結果は、CanvOI が他のモデルよりも大幅に優れたパフォーマンスを示し、初期コホートのわずか 10% でトレーニングした場合、パフォーマンスの差が大幅に拡大したことを示しています。
この研究は、従来の開発アプローチと統合すれば、オンコロジー・インテリジェンス(OI)を進歩させ、現在の障壁の一部を克服し、最終的にはがん患者の臨床転帰を改善する可能性がある代替アプローチに焦点を当てています。

要約(オリジナル)

The rapidly evolving field of digital oncopathology faces significant challenges, including the need to address diverse and complex clinical questions, often involving rare conditions, with limited availability of labeled data. These limitations hinder the development of robust AI-driven tools in the biomedical space, where accuracy in probabilistic determinations is of utmost importance. To address this, digital pathology foundation models have begun to emerge, typically developed with the size and diversity of the pre-training dataset and model parameters in mind. Here, we present CanvOI, a ViT-g/10-based foundation model designed to enhance the capabilities of digital pathology by addressing these challenges through a different approach. Considering the unique nature of oncologic histopathological images and the requirements from the embeddings to provide meaningful representations for Multiple Instance Learning (MIL) downstream models, we chose to modify the input image characteristics. By introducing larger tile sizes (380 x 380 pixels) and smaller patch sizes (10 x 10 pixels), we were able to optimize the model’s performance, pushing computational resources in a new direction and achieving state-of-the-art performance on cancer-related benchmarks. CanvOI demonstrated a 1.5-7.4% improvement in averaged AUC compared to other leading foundation models built for digital pathology. Moreover, our results demonstrate that CanvOI significantly outperformed the other models, with the performance gap widening substantially when trained on just 10% of the initial cohort. This work highlights an alternative approach that, if integrated with traditional development approaches, has the potential to advance Oncology Intelligence (OI), overcome some of the current barriers and ultimately improve the clinical outcome of cancer patients.

arxiv情報

著者 Jonathan Zalach,Inbal Gazy,Assaf Avinoam,Ron Sinai,Eran Shmuel,Inbar Gilboa,Christine Swisher,Naim Matasci,Reva Basho,David B. Agus
発行日 2024-09-04 17:15:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV パーマリンク