Underwater target detection based on improved YOLOv7

要約

水中ターゲットの検出は、海洋探査の重要な側面です。
ただし、従来の水中ターゲット検出方法は、不正確な特徴抽出、遅い検出速度、複雑な水中環境での堅牢性の欠如など、いくつかの課題に直面しています。
これらの制限に対処するために、この研究では、水中ターゲット検出用の改良された YOLOv7 ネットワーク (YOLOv7-AC) を提案します。
提案されたネットワークは、ACmixBlock モジュールを使用して E-ELAN 構造の 3×3 畳み込みブロックを置き換え、ACmixBlock モジュール間にジャンプ接続と 1×1 畳み込みアーキテクチャを組み込んで、特徴抽出とネットワーク推論速度を向上させます。
さらに、ResNet-ACmix モジュールは、特徴情報の損失を回避し、計算を削減するように設計されており、グローバル アテンション メカニズム (GAM) がモデルのバックボーンとヘッド部分に挿入され、特徴抽出が改善されています。
さらに、K-means の代わりに K-means++ アルゴリズムを使用して、アンカー ボックスを取得し、モデルの精度を高めます。
実験結果は、改善された YOLOv7 ネットワークが、元の YOLOv7 モデルやその他の一般的な水中ターゲット検出方法よりも優れていることを示しています。
提案されたネットワークは、URPC データセットと Brackish データセットでそれぞれ 89.6% と 97.4% の平均精度 (mAP) 値を達成し、元の YOLOv7 モデルと比較してより高いフレーム/秒 (FPS) を示しました。
この調査のソース コードは、https://github.com/NZWANG/YOLOV7-AC で公開されています。
結論として、この研究で提案された改善されたYOLOv7ネットワークは、水中ターゲット検出の有望なソリューションを表し、さまざまな水中タスクでの実用的なアプリケーションに大きな可能性を秘めています.

要約(オリジナル)

Underwater target detection is a crucial aspect of ocean exploration. However, conventional underwater target detection methods face several challenges such as inaccurate feature extraction, slow detection speed and lack of robustness in complex underwater environments. To address these limitations, this study proposes an improved YOLOv7 network (YOLOv7-AC) for underwater target detection. The proposed network utilizes an ACmixBlock module to replace the 3×3 convolution block in the E-ELAN structure, and incorporates jump connections and 1×1 convolution architecture between ACmixBlock modules to improve feature extraction and network reasoning speed. Additionally, a ResNet-ACmix module is designed to avoid feature information loss and reduce computation, while a Global Attention Mechanism (GAM) is inserted in the backbone and head parts of the model to improve feature extraction. Furthermore, the K-means++ algorithm is used instead of K-means to obtain anchor boxes and enhance model accuracy. Experimental results show that the improved YOLOv7 network outperforms the original YOLOv7 model and other popular underwater target detection methods. The proposed network achieved a mean average precision (mAP) value of 89.6% and 97.4% on the URPC dataset and Brackish dataset, respectively, and demonstrated a higher frame per second (FPS) compared to the original YOLOv7 model. The source code for this study is publicly available at https://github.com/NZWANG/YOLOV7-AC. In conclusion, the improved YOLOv7 network proposed in this study represents a promising solution for underwater target detection and holds great potential for practical applications in various underwater tasks.

arxiv情報

著者 Kaiyue Liu,Qi Sun,Daming Sun,Mengduo Yang,Nizhuan Wang
発行日 2023-02-14 09:50:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク