YOLOCS: Object Detection based on Dense Channel Compression for Feature Spatial Solidification

要約

この研究では、ネットワーク内の順方向伝播と逆方向伝播に焦点を当てて、特徴精製と勾配逆伝播のプロセス中のチャネル特徴と畳み込みカーネルの間の関連を調べます。
したがって、特徴空間ソリッド化のための高密度チャネル圧縮と呼ばれる方法を提案します。
この方法の中心的な概念を利用して、バックボーンおよびヘッド ネットワーク用の 2 つの革新的なモジュール、フィーチャー空間固化構造用の高密度チャネル圧縮 (DCFS) と非対称マルチレベル圧縮分離ヘッド (ADH) を導入します。
YOLOv5 モデルに統合すると、これら 2 つのモジュールは優れたパフォーマンスを発揮し、YOLOCS と呼ばれる修正モデルが得られます。
MSCOCO データセットで評価すると、大、中、小の YOLOCS モデルでは、それぞれ 50.1%、47.6%、42.5% の AP が得られます。
YOLOv5 モデルと著しく類似した推論速度を維持しながら、大、中、小の YOLOCS モデルは、それぞれ YOLOv5 モデルの AP を 1.1%、2.3%、5.2% 上回っています。

要約(オリジナル)

In this study, we examine the associations between channel features and convolutional kernels during the processes of feature purification and gradient backpropagation, with a focus on the forward and backward propagation within the network. Consequently, we propose a method called Dense Channel Compression for Feature Spatial Solidification. Drawing upon the central concept of this method, we introduce two innovative modules for backbone and head networks: the Dense Channel Compression for Feature Spatial Solidification Structure (DCFS) and the Asymmetric Multi-Level Compression Decoupled Head (ADH). When integrated into the YOLOv5 model, these two modules demonstrate exceptional performance, resulting in a modified model referred to as YOLOCS. Evaluated on the MSCOCO dataset, the large, medium, and small YOLOCS models yield AP of 50.1%, 47.6%, and 42.5%, respectively. Maintaining inference speeds remarkably similar to those of the YOLOv5 model, the large, medium, and small YOLOCS models surpass the YOLOv5 model’s AP by 1.1%, 2.3%, and 5.2%, respectively.

arxiv情報

著者 Lin Huang,Weisheng Li,Linlin Shen,Haojie Fu,Xue Xiao,Suihan Xiao
発行日 2023-08-08 17:49:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク