要約
計算病理学でAIを進めるには、大規模で高品質で多様なデータセットが必要ですが、既存のパブリックデータセットは、多くの場合、臓器の多様性、クラスカバレッジ、または注釈の品質が限られています。
このギャップを埋めるために、皮膚、結腸直腸、胸部を含む複数の器官タイプをカバーする最大のパッチレベルのデータセットである、各臓器の包括的なクラスカバーをカバーする最大のパッチレベルのデータセットであるクモ(監視された病理学の画像と説明リポジトリ)を紹介します。
Spiderは、専門家の病理学者によって検証された高品質の注釈を提供し、周囲のコンテキストパッチを含み、空間コンテキストを提供することで分類パフォーマンスを向上させます。
データセットに沿って、Hibou-L Foundationモデルを使用してSpiderでトレーニングされたベースラインモデルを、注意ベースの分類ヘッドと組み合わせた特徴抽出器として提示します。
モデルは、複数の組織カテゴリにわたって最先端のパフォーマンスを実現し、将来のデジタル病理研究のための強力なベンチマークとして機能します。
パッチ分類を超えて、このモデルは、重要な領域の迅速な識別を可能にし、定量的組織メトリックを可能にし、マルチモーダルアプローチの基礎を確立します。
データセットと訓練されたモデルの両方が、研究、再現性、およびAI駆動型病理開発を進めるために公開されています。
アクセス:https://github.com/histai/spider
要約(オリジナル)
Advancing AI in computational pathology requires large, high-quality, and diverse datasets, yet existing public datasets are often limited in organ diversity, class coverage, or annotation quality. To bridge this gap, we introduce SPIDER (Supervised Pathology Image-DEscription Repository), the largest publicly available patch-level dataset covering multiple organ types, including Skin, Colorectal, and Thorax, with comprehensive class coverage for each organ. SPIDER provides high-quality annotations verified by expert pathologists and includes surrounding context patches, which enhance classification performance by providing spatial context. Alongside the dataset, we present baseline models trained on SPIDER using the Hibou-L foundation model as a feature extractor combined with an attention-based classification head. The models achieve state-of-the-art performance across multiple tissue categories and serve as strong benchmarks for future digital pathology research. Beyond patch classification, the model enables rapid identification of significant areas, quantitative tissue metrics, and establishes a foundation for multimodal approaches. Both the dataset and trained models are publicly available to advance research, reproducibility, and AI-driven pathology development. Access them at: https://github.com/HistAI/SPIDER
arxiv情報
著者 | Dmitry Nechaev,Alexey Pchelnikov,Ekaterina Ivanova |
発行日 | 2025-03-04 18:57:12+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google