Need for Objective Task-based Evaluation of Deep Learning-Based Denoising Methods: A Study in the Context of Myocardial Perfusion SPECT

要約

タイトル: 心筋灌流SPECTの文脈での深層学習に基づく除去方法の客観的なタスクベースの評価の必要性:研究

要約:
– 人工知能ベースの手法は、核医学で注目を集めている。
– 深層学習(DL)に基づくアプローチを使用して、低用量で取得された画像、短時間で取得された画像、またはその両方で取得された画像を除去することがしばしば行われている。
– これらのアプローチの目的は、クリニカルアプリケーションに必要な客観的評価である。
– 核医学画像のためのDLベースの除去手法は、通常RMSEやSSIMなどの信頼性に基づくフィギュア・オブ・メリット(FoMs)を使用して評価されてきた。
– しかし、これらの画像は臨床タスクのために取得されるため、タスクのパフォーマンスに基づいて評価する必要がある。
– この研究の目的は、これらのFoMでの評価が客観的なクリニカルタスクベースの評価と一致するかどうかを調査することであった。
– さらに、DLベースの方法を評価するための理論的分析を提供し、仮想臨床試験(VCT)の有用性を示した。
– DLベースの方法を使用した心筋灌流SPECT画像の除去に関するVCTを実施し、FoMとAUCを使用して評価した。
– AUCは、人間と同じ視覚的特性を持つモデルオブザーバーを使用してMPSイメージの虚血検出タスクのパフォーマンスを定量化する。
– FoMに基づいて、対象のDLベースの方法を使用した除去は、著しく優れた性能を示した。
– しかし、ROC分析に基づいて、除去は改善されず、むしろ検出タスクのパフォーマンスが低下することが多いことが示された。
– 結果から、DLベースの除去手法を客観的なタスクベースの評価に必要であることが明らかになった。
– さらに、VCTを使用してこのような評価を実行する機構を提供し、理論的な処理から、除去手法の性能が制限される理由についても明らかになった。

要約(オリジナル)

Artificial intelligence-based methods have generated substantial interest in nuclear medicine. An area of significant interest has been using deep-learning (DL)-based approaches for denoising images acquired with lower doses, shorter acquisition times, or both. Objective evaluation of these approaches is essential for clinical application. DL-based approaches for denoising nuclear-medicine images have typically been evaluated using fidelity-based figures of merit (FoMs) such as RMSE and SSIM. However, these images are acquired for clinical tasks and thus should be evaluated based on their performance in these tasks. Our objectives were to (1) investigate whether evaluation with these FoMs is consistent with objective clinical-task-based evaluation; (2) provide a theoretical analysis for determining the impact of denoising on signal-detection tasks; (3) demonstrate the utility of virtual clinical trials (VCTs) to evaluate DL-based methods. A VCT to evaluate a DL-based method for denoising myocardial perfusion SPECT (MPS) images was conducted. The impact of DL-based denoising was evaluated using fidelity-based FoMs and AUC, which quantified performance on detecting perfusion defects in MPS images as obtained using a model observer with anthropomorphic channels. Based on fidelity-based FoMs, denoising using the considered DL-based method led to significantly superior performance. However, based on ROC analysis, denoising did not improve, and in fact, often degraded detection-task performance. The results motivate the need for objective task-based evaluation of DL-based denoising approaches. Further, this study shows how VCTs provide a mechanism to conduct such evaluations using VCTs. Finally, our theoretical treatment reveals insights into the reasons for the limited performance of the denoising approach.

arxiv情報

著者 Zitong Yu,Md Ashequr Rahman,Richard Laforest,Thomas H. Schindler,Robert J. Gropler,Richard L. Wahl,Barry A. Siegel,Abhinav K. Jha
発行日 2023-03-30 03:23:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CV, cs.LG, eess.IV, physics.med-ph パーマリンク