Comparative Analysis of Resource-Efficient CNN Architectures for Brain Tumor Classification

要約

MRI画像における正確な脳腫瘍の分類は、タイムリーな診断と治療計画のために重要である。ResNet-18、VGG-16のようなディープラーニングモデルは高い精度を示しているが、しばしば複雑さと計算需要の増加を伴う。本研究では、脳腫瘍分類のための、効果的かつシンプルな畳み込みニューラルネットワーク(CNN)アーキテクチャと、事前学習済みのResNet18、およびVGG16モデルの比較分析を、2つの一般公開データセットを用いて行う:Br35H::Brain Tumor Detection 2020とBrain Tumor MRI Datasetである。カスタムCNNアーキテクチャは、複雑度が低いにもかかわらず、事前に訓練されたResNet18やVGG16モデルと遜色のない性能を示した。バイナリ分類タスクでは、カスタムCNNはBr35Hデータセットで98.67%、脳腫瘍MRIデータセットで99.62%の精度を達成した。マルチクラス分類では、アーキテクチャを少し変更したカスタムCNNは、脳腫瘍MRIデータセットで98.09%の精度を達成した。比較的、ResNet18とVGG16は高い性能レベルを維持したが、カスタムCNNはより計算効率の高い代替手段を提供した。さらに、カスタムCNNのロバスト性を評価するため、数ショット学習(0、5、10、15、20、40、80ショット)を用いて評価したところ、ショットの増加とともに顕著な精度向上を達成した。この研究は、脳腫瘍分類を含む医療画像処理タスクにおいて、より深く事前に訓練されたモデルに代わる、効果的で計算効率の良い、あまり複雑でないCNNアーキテクチャの可能性を強調するものである。この研究は、医用画像処理タスクにおけるカスタムCNNの可能性を強調し、この方向でのさらなる研究を促すものである。

要約(オリジナル)

Accurate brain tumor classification in MRI images is critical for timely diagnosis and treatment planning. While deep learning models like ResNet-18, VGG-16 have shown high accuracy, they often come with increased complexity and computational demands. This study presents a comparative analysis of effective yet simple Convolutional Neural Network (CNN) architecture and pre-trained ResNet18, and VGG16 model for brain tumor classification using two publicly available datasets: Br35H:: Brain Tumor Detection 2020 and Brain Tumor MRI Dataset. The custom CNN architecture, despite its lower complexity, demonstrates competitive performance with the pre-trained ResNet18 and VGG16 models. In binary classification tasks, the custom CNN achieved an accuracy of 98.67% on the Br35H dataset and 99.62% on the Brain Tumor MRI Dataset. For multi-class classification, the custom CNN, with a slight architectural modification, achieved an accuracy of 98.09%, on the Brain Tumor MRI Dataset. Comparatively, ResNet18 and VGG16 maintained high performance levels, but the custom CNNs provided a more computationally efficient alternative. Additionally,the custom CNNs were evaluated using few-shot learning (0, 5, 10, 15, 20, 40, and 80 shots) to assess their robustness, achieving notable accuracy improvements with increased shots. This study highlights the potential of well-designed, less complex CNN architectures as effective and computationally efficient alternatives to deeper, pre-trained models for medical imaging tasks, including brain tumor classification. This study underscores the potential of custom CNNs in medical imaging tasks and encourages further exploration in this direction.

arxiv情報

著者 Md Ashik Khan,Rafath Bin Zafar Auvee
発行日 2024-12-03 16:28:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: 92C55, cs.CV, eess.IV, I.2.10, I.4.8 パーマリンク