MonoVisual3DFilter: 3D tomatoes’ localisation with monocular cameras using histogram filters

要約

果物のモニタリングや収穫など、農業における作業の実行には、対象物の空間的な位置を認識する必要がある。RGB-Dカメラは、雷の干渉を受けるため、オープンフィールド環境では限界がある。そこで本研究では、「3Dタスク空間における物体の位置を認識するために、単眼センサーをどのように使用し、制御できるか」という研究課題に答えることを目的とする。この目的に向けて、我々はヒストグラムフィルター(ベイズ離散フィルター)にアプローチし、MonoVisual3DFilterというアルゴリズムを通してトマト工場内のトマトの位置を推定した。正方カーネルとガウシアンカーネルの2つのカーネルフィルターを研究した。実装されたアルゴリズムは、ガウシアンノイズとランダムノイズの有無によるシミュレーションと、実験室条件でのテストベッドでエッセイされた。このアルゴリズムは、約0.5mの評価距離の実験室条件下で、シミュレーションでは10mm以下、テストベッドでは20mmの平均絶対誤差を報告した。

要約(オリジナル)

Performing tasks in agriculture, such as fruit monitoring or harvesting, requires perceiving the objects’ spatial position. RGB-D cameras are limited under open-field environments due to lightning interferences. So, in this study, we state to answer the research question: ‘How can we use and control monocular sensors to perceive objects’ position in the 3D task space?’ Towards this aim, we approached histogram filters (Bayesian discrete filters) to estimate the position of tomatoes in the tomato plant through the algorithm MonoVisual3DFilter. Two kernel filters were studied: the square kernel and the Gaussian kernel. The implemented algorithm was essayed in simulation, with and without Gaussian noise and random noise, and in a testbed at laboratory conditions. The algorithm reported a mean absolute error lower than 10 mm in simulation and 20 mm in the testbed at laboratory conditions with an assessing distance of about 0.5 m. So, the results are viable for real environments and should be improved at closer distances.

arxiv情報

著者 Sandro Costa Magalhães,Filipe Neves dos Santos,António Paulo Moreira,Jorge Dias
発行日 2024-10-03 22:07:18+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, cs.RO パーマリンク