要約
医用画像における AI モデルの信頼性は、再現性の問題や不明瞭な臨床洞察によってしばしば疑問にさらされています。この現実は、新型コロナウイルス感染症のパンデミック中に、すべてが一般化できなかったほぼ完璧な人工知能 (AI) モデルに関する多くの報告によって浮き彫りになりました。
これらの懸念に対処するために、私たちは、臨床画像とシミュレーション画像の両方である医療画像の多様なコレクションを使用する、仮想イメージング試験フレームワークを提案します。
この研究では、新型コロナウイルス感染症を事例として、AI のパフォーマンスに影響を与える内的要因と外的要因を明らかにします。
私たちの調査結果は、データセットの特性が AI の有効性に大きな影響を与えることを強調しています。
数千人の患者を含む大規模で多様な臨床データセットでトレーニングした場合でも、一般化して AI のパフォーマンスが最大 20% 低下しました。
ただし、仮想イメージング試験は客観的な評価のための堅牢なプラットフォームを提供し、患者および物理ベースの要因と AI パフォーマンスとの関係についての微妙な洞察を明らかにします。
例えば、疾患の程度は AI の有効性に顕著な影響を及ぼし、コンピュータ断層撮影 (CT) の性能は胸部 X 線撮影 (CXR) を上回りましたが、画像化線量の影響は最小限でした。
新型コロナウイルス感染症をケーススタディとして使用したこの仮想イメージング試験研究では、放射線科 AI モデルがしばしば再現性の危機に直面していることが検証されました。
仮想イメージング試験は、客観的なパフォーマンス評価のためのソリューションを提供しただけでなく、いくつかの臨床的洞察も抽出しました。
この研究は、仮想イメージングを活用して医療画像処理における AI の信頼性、透明性、臨床的関連性を強化する道筋を明らかにしています。
要約(オリジナル)
The credibility of AI models in medical imaging is often challenged by reproducibility issues and obscured clinical insights, a reality highlighted during the COVID-19 pandemic by many reports of near-perfect artificial intelligence (AI) models that all failed to generalize. To address these concerns, we propose a virtual imaging trial framework, employing a diverse collection of medical images that are both clinical and simulated. In this study, COVID-19 serves as a case example to unveil the intrinsic and extrinsic factors influencing AI performance. Our findings underscore a significant impact of dataset characteristics on AI efficacy. Even when trained on large, diverse clinical datasets with thousands of patients, AI performance plummeted by up to 20% in generalization. However, virtual imaging trials offer a robust platform for objective assessment, unveiling nuanced insights into the relationships between patient- and physics-based factors and AI performance. For instance, disease extent markedly influenced AI efficacy, computed tomography (CT) out-performed chest radiography (CXR), while imaging dose exhibited minimal impact. Using COVID-19 as a case study, this virtual imaging trial study verified that radiology AI models often suffer from a reproducibility crisis. Virtual imaging trials not only offered a solution for objective performance assessment but also extracted several clinical insights. This study illuminates the path for leveraging virtual imaging to augment the reliability, transparency, and clinical relevance of AI in medical imaging.
arxiv情報
| 著者 | Fakrul Islam Tushar,Lavsen Dahal,Saman Sotoudeh-Paima,Ehsan Abadi,W. Paul Segars,Ehsan Samei,Joseph Y. Lo | 
| 発行日 | 2024-03-31 19:28:25+00:00 | 
| arxivサイト | arxiv_id(pdf) | 
提供元, 利用サービス
arxiv.jp, Google
