Distilling High Diagnostic Value Patches for Whole Slide Image Classification Using Attention Mechanism

要約

マルチ インスタンス学習 (MIL) は、ピクセル レベルの手動注釈をラベルとしての診断レポートに置き換え、人件費を大幅に削減するため、スライド画像全体 (WSI) 分類の分野で広く注目を集めています。
最近の研究では、バッグレベルの MIL メソッドは、WSI のすべてのパッチを全体として考慮できるため、より良い結果が得られることが多いことが示されています。
ただし、このような方法の欠点は、より冗長なパッチが組み込まれ、干渉が発生することです。
この問題に対処するために干渉するパッチを除外しながら、診断価値の高いパッチを抽出するために、私たちはアテンションベースの特徴抽出マルチインスタンス学習 (AFD-MIL) アプローチを開発しました。
このアプローチは、弱教師あり学習の前処理操作として冗長なパッチを除外し、広範なノイズからの干渉を直接軽減することを提案しました。
また、すべてのパッチを無差別かつ強制的に統合する従来の手法とは対照的に、診断価値の高い機能を抽出するためのアテンション メカニズムの使用の先駆者でもあります。
さらに、特徴抽出モジュールを細かく制御するために、グローバル損失最適化を導入しました。
AFD-MIL は多くの既存の MIL メソッドと直交しており、一貫したパフォーマンスの向上につながります。
このアプローチは現在の最先端の方法を上回り、Camelyon16 (Camelyon Challenge 2016、乳がん) では 91.47% ACC (精度) と 94.29% AUC (曲線下面積) を達成しましたが、93.33% ACC と 98.17
TCGA-NSCLC (がんゲノム アトラス プログラム: 非小細胞肺がん) の AUC %。
特定の疾患に合わせて 2 つのデータセットに異なる特徴抽出方法が使用され、それによりパフォーマンスと解釈可能性が向上しました。

要約(オリジナル)

Multiple Instance Learning (MIL) has garnered widespread attention in the field of Whole Slide Image (WSI) classification as it replaces pixel-level manual annotation with diagnostic reports as labels, significantly reducing labor costs. Recent research has shown that bag-level MIL methods often yield better results because they can consider all patches of the WSI as a whole. However, a drawback of such methods is the incorporation of more redundant patches, leading to interference. To extract patches with high diagnostic value while excluding interfering patches to address this issue, we developed an attention-based feature distillation multi-instance learning (AFD-MIL) approach. This approach proposed the exclusion of redundant patches as a preprocessing operation in weakly supervised learning, directly mitigating interference from extensive noise. It also pioneers the use of attention mechanisms to distill features with high diagnostic value, as opposed to the traditional practice of indiscriminately and forcibly integrating all patches. Additionally, we introduced global loss optimization to finely control the feature distillation module. AFD-MIL is orthogonal to many existing MIL methods, leading to consistent performance improvements. This approach has surpassed the current state-of-the-art method, achieving 91.47% ACC (accuracy) and 94.29% AUC (area under the curve) on the Camelyon16 (Camelyon Challenge 2016, breast cancer), while 93.33% ACC and 98.17% AUC on the TCGA-NSCLC (The Cancer Genome Atlas Program: non-small cell lung cancer). Different feature distillation methods were used for the two datasets, tailored to the specific diseases, thereby improving performance and interpretability.

arxiv情報

著者 Tianhang Nan,Hao Quan,Yong Ding,Xingyu Li,Kai Yang,Xiaoyu Cui
発行日 2024-08-16 10:23:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV, q-bio.TO パーマリンク