Calibrated Diverse Ensemble Entropy Minimization for Robust Test-Time Adaptation in Prostate Cancer Detection

要約

高解像度のマイクロ超音波はリアルタイムの前立腺がん検出において有望であることが実証されており、ディープラーニングは超音波に反映される複雑な組織特性を学習するための有力なツールとなりつつあります。
しかし、現実世界への展開には大きな障害が残っており、これは従来の研究では見落とされがちでしたが、異なる臨床センターからのデータに適用すると、データ分布の変動によりモデルのパフォーマンスが低下します。
この分布の変化はモデルの堅牢性に大きな影響を与え、臨床展開に大きな課題をもたらします。
ドメイン アダプテーション、特にそのテスト時アダプテーション (TTA) バリアントは、この課題に対処するための有望なソリューションを提供します。
現実世界の状況を反映するように設計された設定で、既存の方法とがん検出に採用されている最先端の TTA アプローチを比較し、前者では分布の変化に対する堅牢性が欠如していることを実証しました。
次に、超音波データに対する現在の TTA 法の有効性に疑問を呈し、Diverse Ensemble Entropy Minimization (DEnEM) を提案します。
これらの手法は、ベースラインを上回っていても、ニューラル ネットワークの出力確率に依存しているため (校正されていない可能性があり)、またはデータ拡張に依存しているため、次善の手法であることを示します。これは、超音波データで定義するのが簡単ではありません。
私たちの結果は、既存の手法と比較して AUROC で $5\%$ から $7\%$ 、TTA 手法と比較して $3\%$ から $5\%$ の大幅な改善を示しており、分布シフトへの対処における DEnEM の利点を示しています。
\keywords{超音波画像診断、前立腺がん、コンピュータ支援診断、分布シフトの堅牢性、検査時間の適応}

要約(オリジナル)

High resolution micro-ultrasound has demonstrated promise in real-time prostate cancer detection, with deep learning becoming a prominent tool for learning complex tissue properties reflected on ultrasound. However, a significant roadblock to real-world deployment remains, which prior works often overlook: model performance suffers when applied to data from different clinical centers due to variations in data distribution. This distribution shift significantly impacts the model’s robustness, posing major challenge to clinical deployment. Domain adaptation and specifically its test-time adaption (TTA) variant offer a promising solution to address this challenge. In a setting designed to reflect real-world conditions, we compare existing methods to state-of-the-art TTA approaches adopted for cancer detection, demonstrating the lack of robustness to distribution shifts in the former. We then propose Diverse Ensemble Entropy Minimization (DEnEM), questioning the effectiveness of current TTA methods on ultrasound data. We show that these methods, although outperforming baselines, are suboptimal due to relying on neural networks output probabilities, which could be uncalibrated, or relying on data augmentation, which is not straightforward to define on ultrasound data. Our results show a significant improvement of $5\%$ to $7\%$ in AUROC over the existing methods and $3\%$ to $5\%$ over TTA methods, demonstrating the advantage of DEnEM in addressing distribution shift. \keywords{Ultrasound Imaging \and Prostate Cancer \and Computer-aided Diagnosis \and Distribution Shift Robustness \and Test-time Adaptation.}

arxiv情報

著者 Mahdi Gilany,Mohamed Harmanani,Paul Wilson,Minh Nguyen Nhat To,Amoon Jamzad,Fahimeh Fooladgar,Brian Wodlinger,Purang Abolmaesumi,Parvin Mousavi
発行日 2024-07-17 16:20:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク