Embedding Space Augmentation for Weakly Supervised Learning in Whole-Slide Images

要約

複数インスタンス学習 (MIL) は、WSI レベルの注釈からギガピクセルのスライド全体の画像 (WSI) を学習するために広く使用されているフレームワークです。
WSI レベルの分析のためのほとんどの MIL ベースの分析パイプラインでは、WSI は多くの場合、パッチに分割され、パッチの深い特徴 (つまり、パッチの埋め込み) がトレーニングの前に抽出され、全体的な計算コストを削減し、GPU の限られた RAM に対処します。
この制限を克服するために、ピクセル空間ではなく埋め込み空間でデータ拡張を合成できるデータ拡張敵対的生成ネットワーク (DA-GAN) である EmbAugmenter を提示し、それによって計算要件を大幅に削減します。
SICAPv2 データセットでの実験では、私たちのアプローチが拡張なしの MIL よりも優れており、MIL トレーニングの従来のパッチレベルの拡張と同等でありながら、大幅に高速であることが示されています。

要約(オリジナル)

Multiple Instance Learning (MIL) is a widely employed framework for learning on gigapixel whole-slide images (WSIs) from WSI-level annotations. In most MIL based analytical pipelines for WSI-level analysis, the WSIs are often divided into patches and deep features for patches (i.e., patch embeddings) are extracted prior to training to reduce the overall computational cost and cope with the GPUs’ limited RAM. To overcome this limitation, we present EmbAugmenter, a data augmentation generative adversarial network (DA-GAN) that can synthesize data augmentations in the embedding space rather than in the pixel space, thereby significantly reducing the computational requirements. Experiments on the SICAPv2 dataset show that our approach outperforms MIL without augmentation and is on par with traditional patch-level augmentation for MIL training while being substantially faster.

arxiv情報

著者 Imaad Zaffar,Guillaume Jaume,Nasir Rajpoot,Faisal Mahmood
発行日 2022-10-31 02:06:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, I.4.0 パーマリンク