PreMix: Boosting Multiple Instance Learning in Digital Histopathology through Pre-training with Intra-Batch Slide Mixing

要約

ギガピクセルサイズのホールスライド画像(WSI)の分類は、高解像度スキャナで得られた組織学的スライドのデジタル表現であるが、きめ細かなラベリングが必要で時間がかかるという大きな課題に直面している。弱教師付き多重インスタンス学習(MIL)は有望なアプローチとして浮上しているが、現在のMIL手法は、ラベル付けされていないWSIに埋め込まれた豊富な情報を活用する能力が限られているため、制約を受けている。この制限のために、特徴抽出プロセスの後にMIL特徴集約器を一から学習する必要があり、効率と精度の妨げとなっている。PreMixは、バッチ内スライド混合アプローチでMILアグリゲータを事前学習することにより、一般的なMILフレームワークを拡張する。具体的には、PreMixは事前学習中にBarlow Twins Slide Mixingを組み込み、多様なWSIサイズを扱う能力を強化し、ラベル付けされていないWSIの有用性を最大化する。微調整中のMixupとManifold Mixupを組み合わせることで、PreMixはCamelyon16データセットにおいて、ベースラインのMILフレームワークである階層画像ピラミッド変換器(HIPT)に対して平均4.7%の性能向上を達成した。様々な能動学習獲得関数とWSIラベル付き学習予算にわたって観察された改善は、多様なデータセットと様々なリソース制約に対するフレームワークの適応性を浮き彫りにしている。最終的に、PreMixは、限られたWSIラベル付きデータセットにおいて、より効率的で正確なWSI分類への道を開き、病理組織学研究におけるラベルなしWSIデータの広範な採用を促進する。コードは https://anonymous.4open.science/r/PreMix で入手できる。

要約(オリジナル)

The classification of gigapixel-sized whole slide images (WSIs), digital representations of histological slides obtained via a high-resolution scanner, faces significant challenges associated with the meticulous and time-consuming nature of fine-grained labeling. While weakly-supervised multiple instance learning (MIL) has emerged as a promising approach, current MIL methods are constrained by their limited ability to leverage the wealth of information embedded within unlabeled WSIs. This limitation often necessitates training MIL feature aggregators from scratch after the feature extraction process, hindering efficiency and accuracy. PreMix extends the general MIL framework by pre-training the MIL aggregator with an intra-batch slide mixing approach. Specifically, PreMix incorporates Barlow Twins Slide Mixing during pre-training, enhancing its ability to handle diverse WSI sizes and maximizing the utility of unlabeled WSIs. Combined with Mixup and Manifold Mixup during fine-tuning, PreMix achieves a mean of 4.7% performance improvement over the baseline MIL framework, the hierarchical image pyramid transformer (HIPT), on the Camelyon16 dataset. The observed improvement across a range of active learning acquisition functions and WSI-labeled training budgets highlights the framework’s adaptability to diverse datasets and varying resource constraints. Ultimately, PreMix paves the way for more efficient and accurate WSI classification under limited WSI-labeled datasets, encouraging the broader adoption of unlabeled WSI data in histopathological research. The code is available at https://anonymous.4open.science/r/PreMix

arxiv情報

著者 Bryan Wong,Mun Yong Yi
発行日 2024-08-02 10:24:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク