要約
物体検出アルゴリズム、特にYOLOに基づくアルゴリズムは、速度と精度のバランスにおいて顕著な効率性を示している。しかし、脳腫瘍検出への応用はまだ十分に検討されていない。本研究では、RepVGG-GELANを提案する。RepVGG-GELANは、RepVGGで強化された新しいYOLOアーキテクチャであり、特に医療画像内の脳腫瘍検出に焦点を当てた物体検出タスクのための再パラメータ化畳み込みアプローチである。RepVGG-GELANは、RepVGGアーキテクチャを活用して、脳腫瘍の検出速度と精度の両方を向上させます。RepVGGをYOLOフレームワークに統合することで、計算効率と検出性能のバランスを達成することを目指している。本研究では、RepVGGの能力をさらに向上させる空間ピラミッドプーリングベースの一般化効率化層集約ネットワーク(GELAN)アーキテクチャを含む。脳腫瘍データセットを用いて行った実験評価により、RepVGG-GELANの有効性が、精度と速度の点で既存のRCS-YOLOを上回ることが実証された。具体的には、RepVGG-GELANは240.7GFLOPsで動作しながら、最新の既存アプローチと比較して4.91%の精度向上と2.54%のAP50向上を達成した。GELANアーキテクチャを用いた提案のRepVGG-GELANは、医療画像における正確で効率的な脳腫瘍検出のための最先端のソリューションとして確立する有望な結果を示しています。実装コードはhttps://github.com/ThensiB/RepVGG-GELAN。
要約(オリジナル)
Object detection algorithms particularly those based on YOLO have demonstrated remarkable efficiency in balancing speed and accuracy. However, their application in brain tumour detection remains underexplored. This study proposes RepVGG-GELAN, a novel YOLO architecture enhanced with RepVGG, a reparameterized convolutional approach for object detection tasks particularly focusing on brain tumour detection within medical images. RepVGG-GELAN leverages the RepVGG architecture to improve both speed and accuracy in detecting brain tumours. Integrating RepVGG into the YOLO framework aims to achieve a balance between computational efficiency and detection performance. This study includes a spatial pyramid pooling-based Generalized Efficient Layer Aggregation Network (GELAN) architecture which further enhances the capability of RepVGG. Experimental evaluation conducted on a brain tumour dataset demonstrates the effectiveness of RepVGG-GELAN surpassing existing RCS-YOLO in terms of precision and speed. Specifically, RepVGG-GELAN achieves an increased precision of 4.91% and an increased AP50 of 2.54% over the latest existing approach while operating at 240.7 GFLOPs. The proposed RepVGG-GELAN with GELAN architecture presents promising results establishing itself as a state-of-the-art solution for accurate and efficient brain tumour detection in medical images. The implementation code is publicly available at https://github.com/ThensiB/RepVGG-GELAN.
arxiv情報
著者 | Thennarasi Balakrishnan,Sandeep Singh Sengar |
発行日 | 2024-05-06 15:02:16+00:00 |
arxivサイト | arxiv_id(pdf) |