Robotic Handling of Compliant Food Objects by Robust Learning from Demonstration

要約

高い生物学的変異、複雑な幾何学的な 3D 形状、機械的構造と質感を特徴とする、柔軟で変形可能な食品原材料のロボットによるハンドリングは、現在海洋宇宙、農業、食品産業で大きな需要があります。
これらの業界の多くのタスクは人間のオペレーターによって手動で実行されますが、そのタスクの労力と退屈な性質により、実行のばらつきが大きく、結果も変わります。
現在のロボット学習ポリシーにより、最も複雑な処理タスクに対するロボット自動化の導入は困難を極めています。
熟練したオペレーターが関与する、より一貫した学習ポリシーが望まれます。
この論文では、一貫性のないデモンストレーションが提示された場合のロボット学習の問題に取り組みます。
この目的を達成するために、食品準拠物体のロボットによる把握のためのデモンストレーションからの学習 (LfD) に基づいた堅牢な学習ポリシーを提案します。
このアプローチでは、RGB-D 画像と触覚データを組み合わせて、グリッパーの必要な姿勢、グリッパーの指の構成、およびロボットの効果的なハンドリングを実現するために物体にかかる力を推定します。
LfD トレーニング中に、グリッパーのポーズ、指の構成、指の触覚値、および RGB-D 画像が保存されます。
矛盾したデモンストレーションを自動的に削除し、教師の意図するポリシーを推定する LfD 学習ポリシーを提示します。
私たちのアプローチのパフォーマンスは、複雑な 3D 形状を持つ壊れやすい食品オブジェクトに対して検証され、実証されています。
提案されたアプローチには、前述の産業分野で幅広い応用の可能性があります。

要約(オリジナル)

The robotic handling of compliant and deformable food raw materials, characterized by high biological variation, complex geometrical 3D shapes, and mechanical structures and texture, is currently in huge demand in the ocean space, agricultural, and food industries. Many tasks in these industries are performed manually by human operators who, due to the laborious and tedious nature of their tasks, exhibit high variability in execution, with variable outcomes. The introduction of robotic automation for most complex processing tasks has been challenging due to current robot learning policies. A more consistent learning policy involving skilled operators is desired. In this paper, we address the problem of robot learning when presented with inconsistent demonstrations. To this end, we propose a robust learning policy based on Learning from Demonstration (LfD) for robotic grasping of food compliant objects. The approach uses a merging of RGB-D images and tactile data in order to estimate the necessary pose of the gripper, gripper finger configuration and forces exerted on the object in order to achieve effective robot handling. During LfD training, the gripper pose, finger configurations and tactile values for the fingers, as well as RGB-D images are saved. We present an LfD learning policy that automatically removes inconsistent demonstrations, and estimates the teacher’s intended policy. The performance of our approach is validated and demonstrated for fragile and compliant food objects with complex 3D shapes. The proposed approach has a vast range of potential applications in the aforementioned industry sectors.

arxiv情報

著者 Ekrem Misimi,Alexander Olofsson,Aleksander Eilertsen,Elling Ruud Øye,John Reidar Mathiassen
発行日 2023-09-22 13:30:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 99, cs.LG, cs.RO, I.2 パーマリンク