Clinical Melanoma Diagnosis with Artificial Intelligence: Insights from a Prospective Multicenter Study

要約

世界中で有病率が高く、致死性の可能性がある皮膚がんである黒色腫を早期に検出すると、患者の予後が改善されます。
遡及研究では、人工知能 (AI) が黒色腫の検出を強化するのに役立つことが証明されています。
しかし、これらの有望な結果を確認する前向き研究はほとんどありません。
既存の研究は、サンプルサイズが小さいこと、データセットが均質すぎること、または希少な黒色腫サブタイプが含まれていないことによって制限されており、臨床現場での応用にとって重要な側面である AI とその一般化可能性の公正かつ徹底的な評価が妨げられています。
したがって、我々は、黒色腫を検出するための確立されたオープンソースのアンサンブル アルゴリズムである「All Data are Ext」(ADAE)を、8 つの異なる病院、および 4 つの異なる病院から構成される前向きに収集された外部の異種テスト セットでの皮膚科医の診断精度と比較することによって評価しました。
さまざまなカメラ設定、まれな黒色腫のサブタイプ、特殊な解剖学的部位。
私たちは、リアルテストタイムオーグメンテーション(R-TTA、つまり、複数の角度から撮影された病変の実際の写真を提供し、予測を平均化する)を使用してアルゴリズムを進歩させ、その一般化機能を評価しました。
全体として、AI は皮膚科医よりもバランスの取れた精度が高く (0.798、95% 信頼区間 (CI) 0.779-0.814 vs. 0.781、95% CI 0.760-0.802; p<0.001)、より高い感度 (0.921、95% CI 0.900) を示しました。 - 0.942 vs. 0.734、95% CI 0.701-0.770; p<0.001)、特異性は低くなります (0.673、95% CI 0.641-0.702 vs. 0.828、95% CI 0.804-0.852; p<0.001)。 このアルゴリズムは、黒色腫の疑いのある病変のみを含む異種データセットで顕著なパフォーマンス上の利点を示したため、AI は、特に困難な症例の診断において皮膚科医をサポートする可能性を提供する可能性があります。

要約(オリジナル)

Early detection of melanoma, a potentially lethal type of skin cancer with high prevalence worldwide, improves patient prognosis. In retrospective studies, artificial intelligence (AI) has proven to be helpful for enhancing melanoma detection. However, there are few prospective studies confirming these promising results. Existing studies are limited by low sample sizes, too homogenous datasets, or lack of inclusion of rare melanoma subtypes, preventing a fair and thorough evaluation of AI and its generalizability, a crucial aspect for its application in the clinical setting. Therefore, we assessed ‘All Data are Ext’ (ADAE), an established open-source ensemble algorithm for detecting melanomas, by comparing its diagnostic accuracy to that of dermatologists on a prospectively collected, external, heterogeneous test set comprising eight distinct hospitals, four different camera setups, rare melanoma subtypes, and special anatomical sites. We advanced the algorithm with real test-time augmentation (R-TTA, i.e. providing real photographs of lesions taken from multiple angles and averaging the predictions), and evaluated its generalization capabilities. Overall, the AI showed higher balanced accuracy than dermatologists (0.798, 95% confidence interval (CI) 0.779-0.814 vs. 0.781, 95% CI 0.760-0.802; p<0.001), obtaining a higher sensitivity (0.921, 95% CI 0.900- 0.942 vs. 0.734, 95% CI 0.701-0.770; p<0.001) at the cost of a lower specificity (0.673, 95% CI 0.641-0.702 vs. 0.828, 95% CI 0.804-0.852; p<0.001). As the algorithm exhibited a significant performance advantage on our heterogeneous dataset exclusively comprising melanoma-suspicious lesions, AI may offer the potential to support dermatologists particularly in diagnosing challenging cases.

arxiv情報

著者 Lukas Heinlein,Roman C. Maron,Achim Hekler,Sarah Haggenmüller,Christoph Wies,Jochen S. Utikal,Friedegund Meier,Sarah Hobelsberger,Frank F. Gellrich,Mildred Sergon,Axel Hauschild,Lars E. French,Lucie Heinzerling,Justin G. Schlager,Kamran Ghoreschi,Max Schlaak,Franz J. Hilke,Gabriela Poch,Sören Korsing,Carola Berking,Markus V. Heppt,Michael Erdmann,Sebastian Haferkamp,Konstantin Drexler,Dirk Schadendorf,Wiebke Sondermann,Matthias Goebeler,Bastian Schilling,Eva Krieghoff-Henning,Titus J. Brinker
発行日 2024-01-25 14:03:54+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV, stat.AP パーマリンク