要約
自律的な空中収穫は、非常に複雑な問題である。というのも、小型の低電力コンピューティング・デバイスで実行するために、多くの学際的なアルゴリズムを必要とするからである。物体検出はそのようなアルゴリズムの1つであり、計算負荷が高い。(i)高速果実検出器(Fast Fruit Detector: FFD)は、我々の新しい潜在物体表現(latent object representation: LOR)モジュール、クエリー割り当て、予測戦略に基づく、リソース効率の良い、シングルステージの、後処理不要の物体検出器である。FFDは、最新の10W NVIDIA Jetson-NX組み込みデバイス上で、制御、把持、SLAMなどの他のタイムクリティカルなサブシステムと共存しながら、100FPS@FP32の精度を達成しており、これは本研究の大きな成果である。(ii) 果物画像は多数のインスタンスから構成されるため、ラベリングコストと時間が増大する。(iii) 検出が困難な非常に小さなサイズのインスタンスを多数含む、オープンソースの果物検出データセット。例えば、FFDはシングルスケールのFaster-RCNNより10.7AP、マルチスケールのFaster-RCNNより2.3AP、最新のシングルスケールのYOLO-v8より8AP、マルチスケールのYOLO-v8より0.3高速である。
要約(オリジナル)
Autonomous aerial harvesting is a highly complex problem because it requires numerous interdisciplinary algorithms to be executed on mini low-powered computing devices. Object detection is one such algorithm that is compute-hungry. In this context, we make the following contributions: (i) Fast Fruit Detector (FFD), a resource-efficient, single-stage, and postprocessing-free object detector based on our novel latent object representation (LOR) module, query assignment, and prediction strategy. FFD achieves 100FPS@FP32 precision on the latest 10W NVIDIA Jetson-NX embedded device while co-existing with other time-critical sub-systems such as control, grasping, SLAM, a major achievement of this work. (ii) a method to generate vast amounts of training data without exhaustive manual labelling of fruit images since they consist of a large number of instances, which increases the labelling cost and time. (iii) an open-source fruit detection dataset having plenty of very small-sized instances that are difficult to detect. Our exhaustive evaluations on our and MinneApple dataset show that FFD, being only a single-scale detector, is more accurate than many representative detectors, e.g. FFD is better than single-scale Faster-RCNN by 10.7AP, multi-scale Faster-RCNN by 2.3AP, and better than latest single-scale YOLO-v8 by 8AP and multi-scale YOLO-v8 by 0.3 while being considerably faster.
arxiv情報
著者 | Ashish Kumar,Laxmidhar Behera |
発行日 | 2024-03-01 12:58:43+00:00 |
arxivサイト | arxiv_id(pdf) |