要約
計算病理学 (CPath) における機械学習では、マルチギガピクセルの全スライド画像 (WSI) からパッチレベルの予測を集約して、生存予測や薬効予測などの重要なタスクの WSI レベルの予測スコアを生成することがよくあります。
ただし、現在の方法では、WSI 内のパッチ セット間の分布の違いを明示的に特徴付けることはできません。
HistoKernel は、下流予測タスクの予測パフォーマンスを向上させるために WSI 間の分布の類似性を測定する新しい最大平均不一致 (MMD) カーネルです。
当社の包括的な分析では、検索 (n = 9,362)、薬剤感受性回帰 (n = 551)、点突然変異分類 (n = 3,419)、生存分析 (n = 2,291) などのさまざまな機械学習タスクにわたって HistoKernel の有効性が実証され、既存のディープ タスクを上回るパフォーマンスを発揮します。
学習方法。
さらに、HistoKernel はマルチモーダル データをシームレスに統合し、パッチレベルの説明可能性を実現する新しい摂動ベースの方法を提供します。
この研究は、WSI レベルの予測モデリングのためのカーネルベースの手法の使用の先駆者であり、研究に新しい道を開きます。
コードは https://github.com/pkeller00/HistoKernel で入手できます。
要約(オリジナル)
Machine learning in computational pathology (CPath) often aggregates patch-level predictions from multi-gigapixel Whole Slide Images (WSIs) to generate WSI-level prediction scores for crucial tasks such as survival prediction and drug effect prediction. However, current methods do not explicitly characterize distributional differences between patch sets within WSIs. We introduce HistoKernel, a novel Maximum Mean Discrepancy (MMD) kernel that measures distributional similarity between WSIs for enhanced prediction performance on downstream prediction tasks. Our comprehensive analysis demonstrates HistoKernel’s effectiveness across various machine learning tasks, including retrieval (n = 9,362), drug sensitivity regression (n = 551), point mutation classification (n = 3,419), and survival analysis (n = 2,291), outperforming existing deep learning methods. Additionally, HistoKernel seamlessly integrates multi-modal data and offers a novel perturbation-based method for patch-level explainability. This work pioneers the use of kernel-based methods for WSI-level predictive modeling, opening new avenues for research. Code is available at https://github.com/pkeller00/HistoKernel.
arxiv情報
著者 | Piotr Keller,Muhammad Dawood,Brinder Singh Chohan,Fayyaz ul Amir Afsar Minhas |
発行日 | 2024-08-09 17:40:08+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google