Trustworthy image-to-image translation: evaluating uncertainty calibration in unpaired training scenarios

要約

マンモグラフィスクリーニングは、乳がんを検出するための効果的な方法であり、早期診断を促進します。
ただし、画像を手動で検査する必要性は、自動化された診断プロトコルへの欲求を促進し、ヘルスケアシステムに大きな負担をかけます。
深いニューラルネットワークに基づく手法は、いくつかの研究で効果的であることが示されていますが、それらの過剰でも適合する傾向は、一般化や誤診のかなりのリスクを残し、臨床環境での広範な採用を防ぎます。
対応のないトレーニングデータ(どちらの画像スタイルの同じ組織の画像)がない場合にトレーニング画像機能の表現を多様化することにより、一般化可能性を改善する、対応のないニューラルスタイル移転モデルに基づくデータ増強スキームが提案されています。
しかし、これらのモデルは同様にさまざまな病理を発生しやすく、そのパフォーマンスを評価することは、地上の真理/大規模なデータセットなしでは挑戦的です(医療イメージングの場合もよくあることです)。
ここでは、2つのフレームワーク/アーキテクチャを検討します。GANベースのCycleGanと、最近開発された拡散ベースのSyndiffです。
3つのオープンアクセスマンモグラフィデータセットと1つの非医療画像データセットから解析された画像パッチでトレーニングされたときに、パフォーマンスを評価します。
モデルの信頼性を評価するための不確実性の定量化の使用を検討し、対応のないトレーニングシナリオのキャリブレーション品質を評価するスキームを提案します。
これにより、最終的には、地上の真理が一般的に利用できないドメインでの画像から画像への翻訳モデルの信頼できる使用を促進するのに役立ちます。

要約(オリジナル)

Mammographic screening is an effective method for detecting breast cancer, facilitating early diagnosis. However, the current need to manually inspect images places a heavy burden on healthcare systems, spurring a desire for automated diagnostic protocols. Techniques based on deep neural networks have been shown effective in some studies, but their tendency to overfit leaves considerable risk for poor generalisation and misdiagnosis, preventing their widespread adoption in clinical settings. Data augmentation schemes based on unpaired neural style transfer models have been proposed that improve generalisability by diversifying the representations of training image features in the absence of paired training data (images of the same tissue in either image style). But these models are similarly prone to various pathologies, and evaluating their performance is challenging without ground truths/large datasets (as is often the case in medical imaging). Here, we consider two frameworks/architectures: a GAN-based cycleGAN, and the more recently developed diffusion-based SynDiff. We evaluate their performance when trained on image patches parsed from three open access mammography datasets and one non-medical image dataset. We consider the use of uncertainty quantification to assess model trustworthiness, and propose a scheme to evaluate calibration quality in unpaired training scenarios. This ultimately helps facilitate the trustworthy use of image-to-image translation models in domains where ground truths are not typically available.

arxiv情報

著者 Ciaran Bench,Emir Ahmed,Spencer A. Thomas
発行日 2025-01-29 11:09:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV, physics.med-ph パーマリンク