Light-YOLOv5: A Lightweight Algorithm for Improved YOLOv5 in Complex Fire Scenarios

要約

防火対策を成功させるには、火災検知技術が非常に重要です。
画像ベースの火災検知は、有効な方法の 1 つです。
現在、オブジェクト検出アルゴリズムは、複雑な火災シナリオに適用される場合、検出速度と精度のタスクを実行するのに不十分です。
この研究では、軽量の火災検出アルゴリズムである Light-YOLOv5 (You Only Look Once バージョン 5) が提示されています。
まず、セパレート ビジョン トランスフォーマー (SepViT) ブロックを使用して、バックボーン ネットワークの最終層にあるいくつかの C3 モジュールを置き換え、バックボーン ネットワークと地球規模の情報との接触と炎と煙の特徴の抽出の両方を強化します。
2 つ目は、ライト双方向フィーチャ ピラミッド ネットワーク (Light-BiFPN) で、モデルを軽量化しながら、フィーチャ抽出を改善し、火災検出手順中の速度と精度のフィーチャのバランスを取るように設計されています。
3 番目に、グローバル アテンション メカニズム (GAM) がネットワークに融合され、モデルがグローバルな次元の特徴により焦点を当て、モデルの検出精度をさらに向上させます。
最後に、Mish 活性化機能と SIOU 損失を利用して、収束速度の向上と精度の向上を同時に実現します。
実験結果は、元のアルゴリズムと比較して、Light-YOLOv5 の平均精度 (mAP) が 3.3% 増加し、パラメーターの数が 27.1% 減少し、浮動小数点演算 (FLOP) が 19.1% 減少することを示しています。
検出速度は 91.1 FPS に達し、複雑な火災シナリオでターゲットをリアルタイムで検出できます。

要約(オリジナル)

Fire-detection technology is of great importance for successful fire-prevention measures. Image-based fire detection is one effective method. At present, object-detection algorithms are deficient in performing detection speed and accuracy tasks when they are applied in complex fire scenarios. In this study, a lightweight fire-detection algorithm, Light-YOLOv5 (You Only Look Once version five), is presented. First, a separable vision transformer (SepViT) block is used to replace several C3 modules in the final layer of a backbone network to enhance both the contact of the backbone network to global in-formation and the extraction of flame and smoke features; second, a light bidirectional feature pyramid network (Light-BiFPN) is designed to lighten the model while improving the feature extraction and balancing speed and accuracy features during a fire-detection procedure; third, a global attention mechanism (GAM) is fused into the network to cause the model to focus more on the global dimensional features and further improve the detection accuracy of the model; and finally, the Mish activation function and SIoU loss are utilized to simultaneously increase the convergence speed and enhance the accuracy. The experimental results show that compared to the original algorithm, the mean average accuracy (mAP) of Light-YOLOv5 increases by 3.3%, the number of parameters decreases by 27.1%, and the floating point operations (FLOPs) decrease by 19.1%. The detection speed reaches 91.1 FPS, which can detect targets in complex fire scenarios in real time.

arxiv情報

著者 Hao Xu,Bo Li,Fei Zhong
発行日 2022-12-01 16:24:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク