Fostc3net:A Lightweight YOLOv5 Based On the Network Structure Optimization

要約

送電線検出技術は、電気設備の自動監視と安全性の確保に不可欠です。
YOLOv5 シリーズは、現在最も先進的で広く使用されている物体検出方法の 1 つです。
ただし、デバイスの計算負荷が高く、検出精度が不十分であるなど、固有の課題に直面しています。
これらの懸念に対処するために、このホワイト ペーパーでは、モバイル デバイス向けにカスタマイズされた、特に伝送路に関連するオブジェクトの識別を目的とした強化された軽量 YOLOv5 技術を紹介します。
C3Ghost モジュールは YOLOv5 の畳み込みネットワークに統合されており、特徴チャネル融合プロセスにおける 1 秒あたりの浮動小数点演算 (FLOP) が削減され、特徴表現のパフォーマンスが向上します。
さらに、YOLOv5 バックボーンの c3 モジュールを置き換えるために、FasterNet モジュールが導入されました。
FasterNet モジュールは、部分畳み込みを使用して入力チャネルの一部のみを処理し、特徴抽出効率を向上させ、計算オーバーヘッドを削減します。
データセット内の単純なサンプルと困難なサンプルの間の不均衡、および境界ボックスのアスペクト比の多様性に対処するために、wIoU v3 LOSS が損失関数として採用されます。
提案されたアプローチのパフォーマンスを検証するために、送電線極のカスタム データセットで実験が行われます。
その結果、提案されたモデルは、既存の YOLOv5 と比較して、検出精度が 1% 向上、FLOP が 13% 減少、モデルパラメータが 26% 減少したことがわかりました。アブレーション実験では、Fastnet が
モジュールと CSghost モジュールは、元の YOLOv5 ベースライン モデルの精度を向上させましたが、mAP@.5-.95 メトリクスの低下を引き起こしました。
ただし、wIoUv3 損失関数の改善により、mAP@.5 ~ .95 メトリックの低下が大幅に軽減されました。

要約(オリジナル)

Transmission line detection technology is crucial for automatic monitoring and ensuring the safety of electrical facilities. The YOLOv5 series is currently one of the most advanced and widely used methods for object detection. However, it faces inherent challenges, such as high computational load on devices and insufficient detection accuracy. To address these concerns, this paper presents an enhanced lightweight YOLOv5 technique customized for mobile devices, specifically intended for identifying objects associated with transmission lines. The C3Ghost module is integrated into the convolutional network of YOLOv5 to reduce floating point operations per second (FLOPs) in the feature channel fusion process and improve feature expression performance. In addition, a FasterNet module is introduced to replace the c3 module in the YOLOv5 Backbone. The FasterNet module uses Partial Convolutions to process only a portion of the input channels, improving feature extraction efficiency and reducing computational overhead. To address the imbalance between simple and challenging samples in the dataset and the diversity of aspect ratios of bounding boxes, the wIoU v3 LOSS is adopted as the loss function. To validate the performance of the proposed approach, Experiments are conducted on a custom dataset of transmission line poles. The results show that the proposed model achieves a 1% increase in detection accuracy, a 13% reduction in FLOPs, and a 26% decrease in model parameters compared to the existing YOLOv5.In the ablation experiment, it was also discovered that while the Fastnet module and the CSghost module improved the precision of the original YOLOv5 baseline model, they caused a decrease in the mAP@.5-.95 metric. However, the improvement of the wIoUv3 loss function significantly mitigated the decline of the mAP@.5-.95 metric.

arxiv情報

著者 Danqing Ma,Shaojie Li,Bo Dang,Hengyi Zang,Xinqi Dong
発行日 2024-03-20 16:07:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク