BGF-YOLO: Enhanced YOLOv8 with Multiscale Attentional Feature Fusion for Brain Tumor Detection

要約

You Only Look Once (YOLO) ベースの物体検出器は、自動脳腫瘍検出において驚くべき精度を示しています。
この論文では、バイレベル ルーティング アテンション (BRA)、一般化機能ピラミッド ネットワーク (GFPN)、および 4 番目の検出ヘッドを YOLOv8 に組み込むことにより、新しい BGF-YOLO アーキテクチャを開発します。
BGF-YOLO には、重要な特徴にさらに焦点を当てるためのアテンション メカニズムと、高レベルの意味論的特徴を空間詳細と結合することで特徴表現を豊かにする特徴ピラミッド ネットワークが含まれています。
さらに、さまざまな注意メカニズムと特徴の融合、検出ヘッドのアーキテクチャが脳腫瘍の検出精度に及ぼす影響を調査します。
実験結果は、BGF-YOLO が YOLOv8x と比較して mAP$_{50}$ の絶対値を 4.7% 増加させ、脳腫瘍検出データセット Br35H に関して最先端を達成することを示しています。
コードは https://github.com/mkang315/BGF-YOLO で入手できます。

要約(オリジナル)

You Only Look Once (YOLO)-based object detectors have shown remarkable accuracy for automated brain tumor detection. In this paper, we develop a novel BGF-YOLO architecture by incorporating Bi-level Routing Attention (BRA), Generalized feature pyramid networks (GFPN), and Fourth detecting head into YOLOv8. BGF-YOLO contains an attention mechanism to focus more on important features, and feature pyramid networks to enrich feature representation by merging high-level semantic features with spatial details. Furthermore, we investigate the effect of different attention mechanisms and feature fusions, detection head architectures on brain tumor detection accuracy. Experimental results show that BGF-YOLO gives a 4.7% absolute increase of mAP$_{50}$ compared to YOLOv8x, and achieves state-of-the-art on the brain tumor detection dataset Br35H. The code is available at https://github.com/mkang315/BGF-YOLO.

arxiv情報

著者 Ming Kang,Chee-Ming Ting,Fung Fung Ting,Raphaël C. -W. Phan
発行日 2023-09-25 14:44:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 62P10, 68T07, 68T10, cs.CV, eess.SP, I.4.6, stat.AP パーマリンク