MobileDenseNet: A new approach to object detection on mobile devices

要約

物体検出の問題解決は、過去数年で大きく発展しました。
ハードウェアの制限が存在する場合には、より軽量なモデルが必要であり、モバイルデバイスに合わせてモデルを調整する必要があります。
この記事では、これらの問題に対処するアルゴリズムを作成するときに使用される方法を評価します。
この記事の主な目標は、速度とリアルタイムの効率を維持しながら、最先端のアルゴリズムの精度を高めることです。
1段階のオブジェクト検出で最も重要な問題は、小さなオブジェクトと不正確なローカリゼーションに関係します。
解決策として、組み込みシステムに適したMobileDenseNetという名前の新しいネットワークを作成しました。
また、小さな物体の検出を支援するモバイルデバイス用のライトネックFCPNLiteを開発しました。
私たちの調査では、組み込みシステムのネックを引用している論文はほとんどないことが明らかになりました。
私たちのネットワークを他のネットワークと差別化するのは、連結機能の使用です。
ネットワークの先頭への小さいながらも重要な変更により、速度を上げたりパラメータを制限したりすることなく、精度が向上しました。
要するに、挑戦的なCoCoおよびPascal VOCデータセットへの焦点は、パーセンテージでそれぞれ24.8および76.8でした。これは、これまでの他の最先端システムによって記録されたものよりも高い率です。
当社のネットワークは、モバイルデバイスでリアルタイムの効率を維持しながら精度を向上させることができます。
Pixel 3(Snapdragon 845)の動作速度を22.8fpsと計算しました。
この調査のソースコードは、https://github.com/hajizadeh/MobileDenseNetで入手できます。

要約(オリジナル)

Object detection problem solving has developed greatly within the past few years. There is a need for lighter models in instances where hardware limitations exist, as well as a demand for models to be tailored to mobile devices. In this article, we will assess the methods used when creating algorithms that address these issues. The main goal of this article is to increase accuracy in state-of-the-art algorithms while maintaining speed and real-time efficiency. The most significant issues in one-stage object detection pertains to small objects and inaccurate localization. As a solution, we created a new network by the name of MobileDenseNet suitable for embedded systems. We also developed a light neck FCPNLite for mobile devices that will aid with the detection of small objects. Our research revealed that very few papers cited necks in embedded systems. What differentiates our network from others is our use of concatenation features. A small yet significant change to the head of the network amplified accuracy without increasing speed or limiting parameters. In short, our focus on the challenging CoCo and Pascal VOC datasets were 24.8 and 76.8 in percentage terms respectively – a rate higher than that recorded by other state-of-the-art systems thus far. Our network is able to increase accuracy while maintaining real-time efficiency on mobile devices. We calculated operational speed on Pixel 3 (Snapdragon 845) to 22.8 fps. The source code of this research is available on https://github.com/hajizadeh/MobileDenseNet.

arxiv情報

著者 Mohammad Hajizadeh,Mohammad Sabokrou,Adel Rahmani
発行日 2022-07-22 12:13:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, cs.NE パーマリンク