MixUp-MIL: Novel Data Augmentation for Multiple Instance Learning and a Study on Thyroid Cancer Diagnosis

要約

複数インスタンス学習は、ピクセルレベルまたはパッチレベルの注釈がない場合に、スライド画像全体をベースとした診断のための強力なアプローチを示す。ホールスライド画像は巨大なサイズであるにもかかわらず、個々のスライドの数はかなり少なく、ラベル付けされたサンプルの数が少ないことが多い。学習を改善するために、我々は特徴ベクトルの線形補間(MixUpと呼ばれる)の考え方に基づく複数インスタンス学習のための様々なデータ増強戦略を提案し、調査する。最新の複数インスタンス学習アーキテクチャと2つの甲状腺がんデータセットに基づき、一般的なデータ増強戦略の範囲を考慮した網羅的な研究を行う。オリジナルのMixUpアプローチに基づいた戦略では精度の低下が見られたのに対し、新しいスライド内補間法を用いることで一貫した精度の向上が見られた。

要約(オリジナル)

Multiple instance learning exhibits a powerful approach for whole slide image-based diagnosis in the absence of pixel- or patch-level annotations. In spite of the huge size of hole slide images, the number of individual slides is often rather small, leading to a small number of labeled samples. To improve training, we propose and investigate different data augmentation strategies for multiple instance learning based on the idea of linear interpolations of feature vectors (known as MixUp). Based on state-of-the-art multiple instance learning architectures and two thyroid cancer data sets, an exhaustive study is conducted considering a range of common data augmentation strategies. Whereas a strategy based on to the original MixUp approach showed decreases in accuracy, the use of a novel intra-slide interpolation method led to consistent increases in accuracy.

arxiv情報

著者 Michael Gadermayr,Lukas Koller,Maximilian Tschuchnig,Lea Maria Stangassinger,Christina Kreutzer,Sebastien Couillard-Despres,Gertie Janneke Oostingh,Anton Hittmair
発行日 2023-07-02 18:27:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.CV パーマリンク