Improving Robustness and Reliability in Medical Image Classification with Latent-Guided Diffusion and Nested-Ensembles

要約

深層学習モデルは、さまざまな医用画像分析タスクにわたって目覚ましい成功を収めていますが、これらのモデルを実際の臨床状況に展開するには、取得した画像の変動に対して堅牢である必要があります。
多くの方法では、事前定義された変換を適用してトレーニング データを強化し、テスト時の堅牢性を高めていますが、これらの変換では、患者画像に見られる多様な変動に対するモデルの堅牢性が保証されない可能性があります。
この論文では、条件付き拡散モデルと結合したトランスフォーマーに基づく新しい 3 段階のアプローチを紹介します。これは、事前に決定されたデータ拡張戦略を必要とせずに、実際に一般的に遭遇する種類の画像変動に対するモデルのロバスト性を向上させることを目的としています。
この目的を達成するために、複数の画像エンコーダはまず階層的な特徴表現を学習して、識別可能な潜在空間を構築します。
次に、潜在コードによって導かれる逆拡散プロセスが、有益な事前情報に基づいて作用し、生成的な方法で予測候補を提案します。
最後に、いくつかの予測候補が 2 レベル集約プロトコルで集約されて、最終出力が生成されます。
医用画像ベンチマーク データセットに関する広範な実験を通じて、私たちの方法がロバスト性と信頼性のキャリブレーションの点で最先端の方法よりも改善されていることを示します。
さらに、予測の不確実性をインスタンスレベルで定量化する戦略を導入し、臨床現場で使用する臨床医の信頼性を高めます。

要約(オリジナル)

While deep learning models have achieved remarkable success across a range of medical image analysis tasks, deployment of these models in real clinical contexts requires that they be robust to variability in the acquired images. While many methods apply predefined transformations to augment the training data to enhance test-time robustness, these transformations may not ensure the model’s robustness to the diverse variability seen in patient images. In this paper, we introduce a novel three-stage approach based on transformers coupled with conditional diffusion models, with the goal of improving model robustness to the kinds of imaging variability commonly encountered in practice without the need for pre-determined data augmentation strategies. To this end, multiple image encoders first learn hierarchical feature representations to build discriminative latent spaces. Next, a reverse diffusion process, guided by the latent code, acts on an informative prior and proposes prediction candidates in a generative manner. Finally, several prediction candidates are aggregated in a bi-level aggregation protocol to produce the final output. Through extensive experiments on medical imaging benchmark datasets, we show that our method improves upon state-of-the-art methods in terms of robustness and confidence calibration. Additionally, we introduce a strategy to quantify the prediction uncertainty at the instance level, increasing their trustworthiness to clinicians using them in clinical practice.

arxiv情報

著者 Xing Shen,Hengguan Huang,Brennan Nichyporuk,Tal Arbel
発行日 2023-10-24 15:53:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク