Efficient Single Object Detection on Image Patches with Early Exit Enhanced High-Precision CNNs

要約

この論文では、ロボカップ スタンダード プラットフォーム リーグのコンテキストにおいて、ボールの検出に主に焦点を当て、移動ロボットを使用して物体を検出するための新しいアプローチを提案します。
課題は、さまざまな照明条件下での動的な物体や、速い動きによって生じるぼやけた画像を検出することにあります。
この課題に対処するために、この論文では、計算的に制約のあるロボット プラットフォーム向けに特別に設計された畳み込みニューラル ネットワーク アーキテクチャを紹介します。
提案された CNN は、画像パッチ内の単一オブジェクトの高精度分類を達成し、それらの正確な空間位置を決定するようにトレーニングされています。
この論文ではさらに、早期終了を既存の高精度 CNN アーキテクチャに統合して、バックグラウンド クラスで簡単に拒否できるケースの計算コストを削減します。
トレーニング プロセスには、動的な重み付けとデータ拡張による信頼性と位置損失に基づく複合損失関数が含まれます。
提案されたアプローチは、仮説あたり約 170 $\mu$s の実行時間を維持しながら、検証データセットで 100% の精度とほぼ 87% の再現率を達成します。
提案されたアプローチと早期終了を組み合わせることで、元の CNN と比較して平均 28% 以上のランタイム最適化を達成できます。
全体として、この論文は、計算上の制約のあるロボット プラットフォームにおける物体、特にボールの検出を強化するための効率的なソリューションを提供します。

要約(オリジナル)

This paper proposes a novel approach for detecting objects using mobile robots in the context of the RoboCup Standard Platform League, with a primary focus on detecting the ball. The challenge lies in detecting a dynamic object in varying lighting conditions and blurred images caused by fast movements. To address this challenge, the paper presents a convolutional neural network architecture designed specifically for computationally constrained robotic platforms. The proposed CNN is trained to achieve high precision classification of single objects in image patches and to determine their precise spatial positions. The paper further integrates Early Exits into the existing high-precision CNN architecture to reduce the computational cost of easily rejectable cases in the background class. The training process involves a composite loss function based on confidence and positional losses with dynamic weighting and data augmentation. The proposed approach achieves a precision of 100% on the validation dataset and a recall of almost 87%, while maintaining an execution time of around 170 $\mu$s per hypotheses. By combining the proposed approach with an Early Exit, a runtime optimization of more than 28%, on average, can be achieved compared to the original CNN. Overall, this paper provides an efficient solution for an enhanced detection of objects, especially the ball, in computationally constrained robotic platforms.

arxiv情報

著者 Arne Moos
発行日 2023-09-07 07:23:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, cs.RO パーマリンク