A Single Multi-Task Deep Neural Network with a Multi-Scale Feature Aggregation Mechanism for Manipulation Relationship Reasoning in Robotic Grasping

要約

複雑で不規則に積み重ねられたシーンで特定のオブジェクトを把握することは、ロボット工学にとって依然として困難です。
なぜなら、ロボットは物体の把持姿勢を識別するだけでなく、物体の操作関係を推論する必要があるからです。
本稿では、ロボット把握タスクのためのマルチスケール特徴集約(MSFA)メカニズムを備えた操作関係推論ネットワークを提案します。
MSFA は、モデルの汎化能力を向上させるために、スケールを超えた接続方法で高レベルの意味情報と低レベルの空間情報を集約します。
さらに、精度を向上させるために、操作関係推論に豊富な位置事前確率を備えた交差特徴を使用することを提案します。
実験は VMRD データセットと実際の環境でそれぞれ検証されます。
実験結果は、提案手法が複数オブジェクトのスタッキングシーンにおけるオブジェクト間の操作関係を正確に予測できることを示しています。
従来の手法と比較して、推論の速度と精度が大幅に向上しました。

要約(オリジナル)

Grasping specific objects in complex and irregularly stacked scenes is still challenging for robotics. Because the robot is not only required to identify the object’s grasping posture but also needs to reason the manipulation relationship between the objects. In this paper, we propose a manipulation relationship reasoning network with a multi-scale feature aggregation (MSFA) mechanism for robot grasping tasks. MSFA aggregates high-level semantic information and low-level spatial information in a cross-scale connection way to improve the generalization ability of the model. Furthermore, to improve the accuracy, we propose to use intersection features with rich location priors for manipulation relationship reasoning. Experiments are validated in VMRD datasets and real environments, respectively. The experimental results demonstrate that our proposed method can accurately predict the manipulation relationship between objects in the scene of multi-object stacking. Compared with previous methods, it significantly improves reasoning speed and accuracy.

arxiv情報

著者 Mingshuai Dong,Yuxuan Bai,Shimin Wei,Xiuli Yu
発行日 2023-05-23 01:46:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク