Slim-neck by GSConv: A better design paradigm of detector architectures for autonomous vehicles

要約

物体検出は、コンピュータビジョンにおける難しい下流タスクである。オンボードのエッジコンピューティングプラットフォームでは、巨大なモデルではリアルタイムでの検出を実現することは困難である。また、深さ方向に分離可能な多数の畳み込み層からなる軽量なモデルでは、十分な精度を得ることができない。そこで本研究では、モデルを軽量化しつつも精度を維持する新しい手法、GSConvを導入する。GSConvは、モデルの精度と速度のバランスをより良くする。また、検出器の設計パラダイムであるスリムネックを提供し、より高い計算コスト効率を達成する。実験では、我々の手法は、オリジナルのネットワークと比較して、最先端の結果(例えば、SO-DA10Mの場合、Tesla T4で〜100FPSの速度で70.9%のmAP0.5)を得ることができました。コードはオープンソースで公開予定です。

要約(オリジナル)

Object detection is a difficult downstream task in computer vision. For the on-board edge computing platforms, a giant model is difficult to achieve the real-time detection requirement. And, a lightweight model built from a large number of the depth-wise separable convolutional layers cannot achieve the sufficient accuracy. We introduce a new method, GSConv, to lighten the model but maintain the accuracy. The GSConv balances the model’s accuracy and speed better. And, we provide a design paradigm, slim-neck, to achieve a higher computational cost-effectiveness of the detectors. In experiments, our method obtains state-of-the-art results (e.g. 70.9% mAP0.5 for the SO-DA10M at a speed of ~100FPS on a Tesla T4) compared with the original networks. Code will be open source.

arxiv情報

著者 Hulin Li,Jun Li,Hanbing Wei,Zheng Liu,Zhenfei Zhan,Qiliang Ren
発行日 2022-06-06 08:34:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク