Deep Learning for Classification of Thyroid Nodules on Ultrasound: Validation on an Independent Dataset

要約

タイトル:甲状腺結節の超音波分類における深層学習:独立したデータセットでの検証

要約:
– 目的:前回の研究で開発された深層学習アルゴリズムを新しい甲状腺結節の超音波画像データセットに適用し、放射線科医との比較を行うことを目的としている。
– 方法:前回の研究で開発されたアルゴリズムは、甲状腺結節を検出し、2つの超音波画像で悪性度分類を行うことができる。1278個の結節から多目的の畳み込みニューラルネットワークをトレーニングし、オリジナルの99個の別々の結節でテストを行った。その結果、放射線科医の結果と比較できるものであった。アルゴリズムは、トレーニングケースよりも異なるメーカーや製品タイプの超音波機で撮影された378個の結節でさらにテストされた。比較のために、4人の経験豊富な放射線科医が結節を評価するよう依頼した。
– 結果:パラメトリック・バイノーマル推定法で深層学習アルゴリズムと4人の放射線科医の曲線下面積(AUC)を計算した。深層学習アルゴリズムのAUCは0.69(95%CI:0.64〜0.75)であった。4人の放射線科医のAUCは、0.63(95%CI:0.59〜0.67)、0.66(95%CI:0.61〜0.71)、0.65(95%CI:0.60〜0.70)、および0.63(95%CI:0.58〜0.67)であった。結論:新しいテストデータセットでは、深層学習アルゴリズムは4人の放射線科医と同等の性能を発揮した。アルゴリズムと放射線科医の相対的な性能差は、超音波スキャナの違いによって有意に影響を受けなかった。

要約(オリジナル)

Objectives: The purpose is to apply a previously validated deep learning algorithm to a new thyroid nodule ultrasound image dataset and compare its performances with radiologists. Methods: Prior study presented an algorithm which is able to detect thyroid nodules and then make malignancy classifications with two ultrasound images. A multi-task deep convolutional neural network was trained from 1278 nodules and originally tested with 99 separate nodules. The results were comparable with that of radiologists. The algorithm was further tested with 378 nodules imaged with ultrasound machines from different manufacturers and product types than the training cases. Four experienced radiologists were requested to evaluate the nodules for comparison with deep learning. Results: The Area Under Curve (AUC) of the deep learning algorithm and four radiologists were calculated with parametric, binormal estimation. For the deep learning algorithm, the AUC was 0.69 (95% CI: 0.64 – 0.75). The AUC of radiologists were 0.63 (95% CI: 0.59 – 0.67), 0.66 (95% CI:0.61 – 0.71), 0.65 (95% CI: 0.60 – 0.70), and 0.63 (95%CI: 0.58 – 0.67). Conclusion: In the new testing dataset, the deep learning algorithm achieved similar performances with all four radiologists. The relative performance difference between the algorithm and the radiologists is not significantly affected by the difference of ultrasound scanner.

arxiv情報

著者 Jingxi Weng,Benjamin Wildman-Tobriner,Mateusz Buda,Jichen Yang,Lisa M. Ho,Brian C. Allen,Wendy L. Ehieli,Chad M. Miller,Jikai Zhang,Maciej A. Mazurowski
発行日 2023-05-04 21:27:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク