YOLOv8-AM: YOLOv8 with Attention Mechanisms for Pediatric Wrist Fracture Detection

要約

手首の外傷、さらには骨折は日常生活の中で頻繁に発生し、特に骨折症例のかなりの割合を占める子供の間で発生します。
手術を行う前に、外科医は患者に最初に X 線撮影を受け、放射線科医の分析に基づいて撮影の準備をするよう要求することがよくあります。
ニューラル ネットワークの発展に伴い、You Only Look Once (YOLO) シリーズ モデルは、コンピューター支援診断 (CAD) としての骨折検出に広く使用されています。
2023 年、Ultralytics は、体のさまざまな部分の骨折を検出するために採用されている YOLO モデルの最新バージョンを発表しました。
アテンション メカニズムは、モデルのパフォーマンスを向上させるための最も注目されている方法の 1 つです。
この研究成果は、元の YOLOv8 アーキテクチャにアテンション メカニズムを組み込んだ YOLOv8-AM を提案しています。
具体的には、畳み込みブロック アテンション モジュール (CBAM)、グローバル アテンション メカニズム (GAM)、効率的なチャネル アテンション (ECA)、およびシャッフル アテンション (SA) の 4 つのアテンション モジュールをそれぞれ使用して、改良されたモデルを設計し、GRAZPEDWRI-DX でトレーニングします。
データセット。
実験結果は、ResBlock + CBAM (ResCBAM) に基づく YOLOv8-AM モデルの IoU 50 (mAP 50) での平均平均精度が 63.6% から 65.8% に増加し、最先端 (SOTA) を達成することを示しています。
パフォーマンス。
逆に、GAM を組み込んだ YOLOv8-AM モデルは 64.2% の mAP 50 値を取得しますが、これは満足のいく向上ではありません。
したがって、ResBlock と GAM を組み合わせ、ResGAM を導入して別の新しい YOLOv8-AM モデルを設計し、その mAP 50 値は 65.0% に増加します。

要約(オリジナル)

Wrist trauma and even fractures occur frequently in daily life, particularly among children who account for a significant proportion of fracture cases. Before performing surgery, surgeons often request patients to undergo X-ray imaging first and prepare for it based on the analysis of the radiologist. With the development of neural networks, You Only Look Once (YOLO) series models have been widely used in fracture detection as computer-assisted diagnosis (CAD). In 2023, Ultralytics presented the latest version of the YOLO models, which has been employed for detecting fractures across various parts of the body. Attention mechanism is one of the hottest methods to improve the model performance. This research work proposes YOLOv8-AM, which incorporates the attention mechanism into the original YOLOv8 architecture. Specifically, we respectively employ four attention modules, Convolutional Block Attention Module (CBAM), Global Attention Mechanism (GAM), Efficient Channel Attention (ECA), and Shuffle Attention (SA), to design the improved models and train them on GRAZPEDWRI-DX dataset. Experimental results demonstrate that the mean Average Precision at IoU 50 (mAP 50) of the YOLOv8-AM model based on ResBlock + CBAM (ResCBAM) increased from 63.6% to 65.8%, which achieves the state-of-the-art (SOTA) performance. Conversely, YOLOv8-AM model incorporating GAM obtains the mAP 50 value of 64.2%, which is not a satisfactory enhancement. Therefore, we combine ResBlock and GAM, introducing ResGAM to design another new YOLOv8-AM model, whose mAP 50 value is increased to 65.0%.

arxiv情報

著者 Chun-Tse Chien,Rui-Yang Ju,Kuang-Yi Chou,Chien-Sheng Lin,Jen-Shiun Chiang
発行日 2024-02-14 17:18:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク