要約
MRI 画像における脳腫瘍の正確な分類は、タイムリーな診断と治療計画にとって重要です。
ResNet-18、VGG-16 などの深層学習モデルは高い精度を示していますが、多くの場合、複雑さと計算量の増加が伴います。
この研究では、2 つの公的に利用可能なデータセット (Br35H:: Brain Tumor Detection 2020 および脳腫瘍 MRI データセット) を使用した、脳腫瘍分類のための効果的かつシンプルな畳み込みニューラル ネットワーク (CNN) アーキテクチャと事前トレーニングされた ResNet18、および VGG16 モデルの比較分析を示します。
カスタム CNN アーキテクチャは、複雑さが低いにもかかわらず、事前トレーニングされた ResNet18 および VGG16 モデルと競合するパフォーマンスを示します。
二値分類タスクでは、カスタム CNN は Br35H データセットで 98.67%、脳腫瘍 MRI データセットで 99.62% の精度を達成しました。
マルチクラス分類の場合、アーキテクチャをわずかに変更したカスタム CNN は、脳腫瘍 MRI データセットで 98.09% の精度を達成しました。
比較すると、ResNet18 と VGG16 は高いパフォーマンス レベルを維持しましたが、カスタム CNN はより計算効率の高い代替手段を提供しました。
さらに、カスタム CNN は少数ショット学習 (0、5、10、15、20、40、および 80 ショット) を使用して堅牢性を評価し、ショットの増加に伴い顕著な精度の向上を達成しました。
この研究は、脳腫瘍分類を含む医用画像タスクのための、より深く事前に訓練されたモデルに代わる効果的かつ計算効率の高い代替手段として、適切に設計された複雑さの少ない CNN アーキテクチャの可能性を強調しています。
この研究は、医療画像タスクにおけるカスタム CNN の可能性を強調し、この方向でのさらなる探究を奨励します。
要約(オリジナル)
Accurate brain tumor classification in MRI images is critical for timely diagnosis and treatment planning. While deep learning models like ResNet-18, VGG-16 have shown high accuracy, they often come with increased complexity and computational demands. This study presents a comparative analysis of effective yet simple Convolutional Neural Network (CNN) architecture and pre-trained ResNet18, and VGG16 model for brain tumor classification using two publicly available datasets: Br35H:: Brain Tumor Detection 2020 and Brain Tumor MRI Dataset. The custom CNN architecture, despite its lower complexity, demonstrates competitive performance with the pre-trained ResNet18 and VGG16 models. In binary classification tasks, the custom CNN achieved an accuracy of 98.67% on the Br35H dataset and 99.62% on the Brain Tumor MRI Dataset. For multi-class classification, the custom CNN, with a slight architectural modification, achieved an accuracy of 98.09%, on the Brain Tumor MRI Dataset. Comparatively, ResNet18 and VGG16 maintained high performance levels, but the custom CNNs provided a more computationally efficient alternative. Additionally,the custom CNNs were evaluated using few-shot learning (0, 5, 10, 15, 20, 40, and 80 shots) to assess their robustness, achieving notable accuracy improvements with increased shots. This study highlights the potential of well-designed, less complex CNN architectures as effective and computationally efficient alternatives to deeper, pre-trained models for medical imaging tasks, including brain tumor classification. This study underscores the potential of custom CNNs in medical imaging tasks and encourages further exploration in this direction.
arxiv情報
| 著者 | Md Ashik Khan,Rafath Bin Zafar Auvee |
| 発行日 | 2024-12-23 16:40:32+00:00 |
| arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google