要約
深層学習モデルは、計算病理学 (CPath) タスクにおいて非常に有望であることが示されていますが、そのパフォーマンスは、ドメインのシフトにより目に見えないデータに適用されると低下することがよくあります。
これに対処するには、ドメイン一般化 (DG) アルゴリズムが必要です。
ただし、CPath のコンテキストにおける DG アルゴリズムの体系的な評価は不足しています。
この研究は、7,560 回の相互検証の実行を通じて、難易度の異なる 3 つの CPath タスクに対する 30 の DG アルゴリズムの有効性をベンチマークすることを目的としています。
私たちは、モダリティ固有の技術と事前トレーニングされた基礎モデルなどの最近の進歩を組み込んだ、統合された堅牢なプラットフォームを使用してこれらのアルゴリズムを評価します。
当社の大規模な相互検証実験により、さまざまな DG 戦略の相対的なパフォーマンスに関する洞察が得られます。
私たちは、自己教師あり学習と染色拡張が他の方法よりも一貫して優れていることを観察し、事前学習済みモデルとデータ拡張の可能性を強調しています。
さらに、将来の研究のベンチマークとして、新しい汎癌腫瘍検出データセット (HISTOPANTUM) を紹介します。
この研究は、CPath タスクに適切な DG アプローチを選択する際に研究者に貴重な指針を提供します。
要約(オリジナル)
Deep learning models have shown immense promise in computational pathology (CPath) tasks, but their performance often suffers when applied to unseen data due to domain shifts. Addressing this requires domain generalization (DG) algorithms. However, a systematic evaluation of DG algorithms in the CPath context is lacking. This study aims to benchmark the effectiveness of 30 DG algorithms on 3 CPath tasks of varying difficulty through 7,560 cross-validation runs. We evaluate these algorithms using a unified and robust platform, incorporating modality-specific techniques and recent advances like pretrained foundation models. Our extensive cross-validation experiments provide insights into the relative performance of various DG strategies. We observe that self-supervised learning and stain augmentation consistently outperform other methods, highlighting the potential of pretrained models and data augmentation. Furthermore, we introduce a new pan-cancer tumor detection dataset (HISTOPANTUM) as a benchmark for future research. This study offers valuable guidance to researchers in selecting appropriate DG approaches for CPath tasks.
arxiv情報
著者 | Neda Zamanitajeddin,Mostafa Jahanifar,Kesi Xu,Fouzia Siraj,Nasir Rajpoot |
発行日 | 2024-09-25 16:21:43+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google