要約
目的: 異なるスキャナーやプロトコルを使用して取得された医療画像は、その外観が大幅に異なる場合があります。
この現象、スキャナ ドメイン シフトにより、あるスキャナで取得したデータでトレーニングされ、別のスキャナでテストされるディープ ニューラル ネットワークのパフォーマンスが低下する可能性があります。
この重要な実際的な問題はよく知られていますが、さまざまなモダリティや診断タスクにわたってこの問題を体系的に研究したものはありません。
材料と方法: この論文では、さまざまな自動診断タスクの畳み込みニューラル ネットワークのパフォーマンスに対するスキャナー ドメインのシフトの影響を評価する広範な実験研究を紹介します。
私たちは、X 線、CT、MRI などの一般的な放射線検査でこの現象を評価します。
結果: 異なるスキャナーからのデータのネットワーク パフォーマンスは、ほとんどの場合、同じスキャナーのデータよりも劣ることがわかり、異なるデータセット間でのパフォーマンスの低下の程度を定量化しました。
特に、この低下は平均して MRI で最も深刻で、X 線では中程度、CT では非常に小さいことがわかりました。これは、MRI や X 線には存在しない CT 取得システムの標準化された性質によるものであると考えられます。
また、トレーニング データにノイズを追加するだけでなく、さまざまな量のターゲット ドメイン データをトレーニング セットに注入することが、一般化にどのように役立つかについても研究します。
結論:私たちの結果は、医用画像解析のための堅牢なディープラーニングモデルの将来の開発を導くことを目的として、さまざまなモダリティにわたるディープラーニングにおけるスキャナードメインのシフトによって引き起こされるパフォーマンス低下の程度の広範な実験的証拠と定量化を提供します。
要約(オリジナル)
Purpose: Medical images acquired using different scanners and protocols can differ substantially in their appearance. This phenomenon, scanner domain shift, can result in a drop in the performance of deep neural networks which are trained on data acquired by one scanner and tested on another. This significant practical issue is well-acknowledged, however, no systematic study of the issue is available across different modalities and diagnostic tasks. Materials and Methods: In this paper, we present a broad experimental study evaluating the impact of scanner domain shift on convolutional neural network performance for different automated diagnostic tasks. We evaluate this phenomenon in common radiological modalities, including X-ray, CT, and MRI. Results: We find that network performance on data from a different scanner is almost always worse than on same-scanner data, and we quantify the degree of performance drop across different datasets. Notably, we find that this drop is most severe for MRI, moderate for X-ray, and quite small for CT, on average, which we attribute to the standardized nature of CT acquisition systems which is not present in MRI or X-ray. We also study how injecting varying amounts of target domain data into the training set, as well as adding noise to the training data, helps with generalization. Conclusion: Our results provide extensive experimental evidence and quantification of the extent of performance drop caused by scanner domain shift in deep learning across different modalities, with the goal of guiding the future development of robust deep learning models for medical image analysis.
arxiv情報
| 著者 | Gregory Szumel,Brian Guo,Darui Lu,Rongze Gui,Tingyu Wang,Nicholas Konz,Maciej A. Mazurowski |
| 発行日 | 2024-09-06 15:59:30+00:00 |
| arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google