High-Speed Detector For Low-Powered Devices In Aerial Grasping

要約

自律的な空中収穫は、非常に複雑な問題である。というのも、小型の低電力コンピューティング・デバイスで実行するために、多くの学際的なアルゴリズムを必要とするからである。物体検出はそのようなアルゴリズムの1つであり、計算負荷が高い。(i)高速果実検出器(Fast Fruit Detector: FFD)は、我々の新しい潜在物体表現(latent object representation: LOR)モジュール、クエリー割り当て、予測戦略に基づく、リソース効率の良い、シングルステージの、後処理不要の物体検出器である。FFDは、最新の10W NVIDIA Jetson-NX組み込みデバイス上で、制御、把持、SLAMなどの他のタイムクリティカルなサブシステムと共存しながら、100FPS@FP32の精度を達成しており、これは本研究の大きな成果である。(ii) 果物画像は多数のインスタンスから構成されるため、ラベリングコストと時間が増大する。(iii) 検出が困難な非常に小さなサイズのインスタンスを多数含む、オープンソースの果物検出データセット。例えば、FFDはシングルスケールのFaster-RCNNより10.7AP、マルチスケールのFaster-RCNNより2.3AP、最新のシングルスケールのYOLO-v8より8AP、マルチスケールのYOLO-v8より0.3高速である。

要約(オリジナル)

Autonomous aerial harvesting is a highly complex problem because it requires numerous interdisciplinary algorithms to be executed on mini low-powered computing devices. Object detection is one such algorithm that is compute-hungry. In this context, we make the following contributions: (i) Fast Fruit Detector (FFD), a resource-efficient, single-stage, and postprocessing-free object detector based on our novel latent object representation (LOR) module, query assignment, and prediction strategy. FFD achieves 100FPS@FP32 precision on the latest 10W NVIDIA Jetson-NX embedded device while co-existing with other time-critical sub-systems such as control, grasping, SLAM, a major achievement of this work. (ii) a method to generate vast amounts of training data without exhaustive manual labelling of fruit images since they consist of a large number of instances, which increases the labelling cost and time. (iii) an open-source fruit detection dataset having plenty of very small-sized instances that are difficult to detect. Our exhaustive evaluations on our and MinneApple dataset show that FFD, being only a single-scale detector, is more accurate than many representative detectors, e.g. FFD is better than single-scale Faster-RCNN by 10.7AP, multi-scale Faster-RCNN by 2.3AP, and better than latest single-scale YOLO-v8 by 8AP and multi-scale YOLO-v8 by 0.3 while being considerably faster.

arxiv情報

著者 Ashish Kumar,Laxmidhar Behera
発行日 2024-03-01 12:58:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, cs.RO パーマリンク