Enhancing Reconstruction-Based Out-of-Distribution Detection in Brain MRI with Model and Metric Ensembles


画像内の異常なパターンがパフォーマンスを妨げる可能性があるため、配信外 (OOD) の検出は自動医用画像分析システムを安全に導入するために重要です。
しかし、医療画像における OOD 検出は依然として未解決の課題であり、私たちは、単純な OOD 検出モデルの潜在的な可能性が十分に解明されていないこと、OOD 検出に特化した深層学習戦略の最適化の欠如、および適切な再構成メトリクスの選択という 3 つのギャップに取り組んでいます。
この研究では、脳 MRI における合成アーチファクトの教師なし検出に対する再構築ベースのオートエンコーダーの有効性を調査しました。
モデルの一般的な再構成能力を評価し、選択したトレーニング エポックと再構成メトリックの影響を分析し、モデルおよび/またはメトリック アンサンブルの可能性を評価し、さまざまなアーティファクトを含むデータセットでモデルをテストしました。
評価されたメトリクスの中で、SSIM と LPIPS のコントラスト コンポーネントは、均質な円形異常の検出において他のメトリクスを常に上回っていました。
2 つの適切に収束したモデルを組み合わせ、LPIPS とコントラストを再構成メトリクスとして使用することにより、0.66 の精度-再現率曲線の下のピクセル レベルの領域を達成しました。
さらに、より現実的な OOD データセットでは、アーティファクトの種類によって検出パフォーマンスが異なることが観察されました。
ローカル アーティファクトは検出がより困難でしたが、グローバル アーティファクトはより良好な検出結果を示しました。
これらの調査結果は、メトリクスとモデル構成を慎重に選択することの重要性を強調し、標準的な深層学習アプローチが OOD 検出特有のニーズと必ずしも一致するとは限らないため、カスタマイズされたアプローチの必要性を強調しています。


Out-of-distribution (OOD) detection is crucial for safely deploying automated medical image analysis systems, as abnormal patterns in images could hamper their performance. However, OOD detection in medical imaging remains an open challenge, and we address three gaps: the underexplored potential of a simple OOD detection model, the lack of optimization of deep learning strategies specifically for OOD detection, and the selection of appropriate reconstruction metrics. In this study, we investigated the effectiveness of a reconstruction-based autoencoder for unsupervised detection of synthetic artifacts in brain MRI. We evaluated the general reconstruction capability of the model, analyzed the impact of the selected training epoch and reconstruction metrics, assessed the potential of model and/or metric ensembles, and tested the model on a dataset containing a diverse range of artifacts. Among the metrics assessed, the contrast component of SSIM and LPIPS consistently outperformed others in detecting homogeneous circular anomalies. By combining two well-converged models and using LPIPS and contrast as reconstruction metrics, we achieved a pixel-level area under the Precision-Recall curve of 0.66. Furthermore, with the more realistic OOD dataset, we observed that the detection performance varied between artifact types; local artifacts were more difficult to detect, while global artifacts showed better detection results. These findings underscore the importance of carefully selecting metrics and model configurations, and highlight the need for tailored approaches, as standard deep learning approaches do not always align with the unique needs of OOD detection.


著者 Evi M. C. Huijben,Sina Amirrajab,Josien P. W. Pluim
発行日 2024-12-23 13:58:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 68T07, cs.CV, cs.LG, eess.IV パーマリンク