MambaMIL: Enhancing Long Sequence Modeling with Sequence Reordering in Computational Pathology

要約

マルチインスタンス学習 (MIL) は、計算病理学においてスライド全体画像 (WSI) 内の識別特徴表現を抽出するための主要なパラダイムとして登場しました。
目覚ましい進歩を遂げているにもかかわらず、既存の MIL アプローチは、インスタンス間の包括的かつ効率的な対話を促進する上での限界や、時間のかかる計算や過剰適合に関する課題に悩まされています。
この論文では、MambaMIL と呼ばれる、線形複雑さを伴う長いシーケンス モデリングのために、複数インスタンス学習 (MIL) に選択的スキャン空間状態逐次モデル (Mamba) を組み込みます。
バニラ Mamba の機能を継承することにより、MambaMIL は、インスタンスの長いシーケンスを包括的に理解して認識する機能を示します。
さらに、長いシーケンスに埋め込まれた固有の貴重な情報を活用する、インスタンスの順序と分布を認識する Sequence Reordering Mamba (SR-Mamba) を提案します。
SR-Mamba をコア コンポーネントとして使用することで、MambaMIL はより多くの識別機能を効果的にキャプチャし、オーバーフィッティングや高い計算オーバーヘッドに関連する課題を軽減できます。
9 つの多様なデータセットにわたる 2 つの公的で困難なタスクに関する広範な実験により、私たちが提案したフレームワークが最先端の MIL 手法に対して有利に機能することが実証されました。
コードは https://github.com/isyangshu/MambaMIL で公開されています。

要約(オリジナル)

Multiple Instance Learning (MIL) has emerged as a dominant paradigm to extract discriminative feature representations within Whole Slide Images (WSIs) in computational pathology. Despite driving notable progress, existing MIL approaches suffer from limitations in facilitating comprehensive and efficient interactions among instances, as well as challenges related to time-consuming computations and overfitting. In this paper, we incorporate the Selective Scan Space State Sequential Model (Mamba) in Multiple Instance Learning (MIL) for long sequence modeling with linear complexity, termed as MambaMIL. By inheriting the capability of vanilla Mamba, MambaMIL demonstrates the ability to comprehensively understand and perceive long sequences of instances. Furthermore, we propose the Sequence Reordering Mamba (SR-Mamba) aware of the order and distribution of instances, which exploits the inherent valuable information embedded within the long sequences. With the SR-Mamba as the core component, MambaMIL can effectively capture more discriminative features and mitigate the challenges associated with overfitting and high computational overhead. Extensive experiments on two public challenging tasks across nine diverse datasets demonstrate that our proposed framework performs favorably against state-of-the-art MIL methods. The code is released at https://github.com/isyangshu/MambaMIL.

arxiv情報

著者 Shu Yang,Yihui Wang,Hao Chen
発行日 2024-03-11 15:17:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク