Slim-neck by GSConv: A better design paradigm of detector architectures for autonomous vehicles

要約

オブジェクト検出は、コンピューター ビジョンにおける重要なダウンストリーム タスクです。
オンボード エッジ コンピューティング プラットフォームの場合、巨大なモデルではリアルタイム検出の要件を満たすことが困難です。
また、多数の深さ方向に分離可能な畳み込み層から構築された軽量モデルでは、十分な精度を達成できません。
モデルを軽量化しながら精度を維持するために、新しい軽量畳み込み手法 GSConv を導入します。
GSConv は、モデルの精度と速度の間で優れたトレードオフを実現します。
また、設計パラダイムであるスリムネックを提供して、検出器の計算コスト効率を高めます。
私たちのアプローチの有効性は、20セットを超える比較実験で確実に実証されました。
特に、私たちのアプローチによって改善された検出器は、オリジナルと比較して最先端の結果を取得します (たとえば、Tesla T4 GPU で ~ 100FPS の速度で SODA10M の 70.9% mAP0.5)。
コードは https://github.com/alanli1997/slim-neck-by-gsconv で入手できます

要約(オリジナル)

Object detection is a significant downstream task in computer vision. For the on-board edge computing platforms, a giant model is difficult to achieve the real-time detection requirement. And, a lightweight model built from a large number of the depth-wise separable convolution layers cannot achieve the sufficient accuracy. We introduce a new lightweight convolution technique, GSConv, to lighten the model but maintain the accuracy. The GSConv accomplishes an excellent trade-off between the model’s accuracy and speed. And, we provide a design paradigm, slim-neck, to achieve a higher computational cost-effectiveness of the detectors. The effectiveness of our approach was robustly demonstrated in over twenty sets comparative experiments. In particular, the detectors of ameliorated by our approach obtains state-of-the-art results (e.g. 70.9% mAP0.5 for the SODA10M at a speed of ~ 100FPS on a Tesla T4 GPU) compared with the originals. Code is available at https://github.com/alanli1997/slim-neck-by-gsconv

arxiv情報

著者 Hulin Li,Jun Li,Hanbing Wei,Zheng Liu,Zhenfei Zhan,Qiliang Ren
発行日 2022-08-17 07:31:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク