Learning Generalizable Tool Use with Non-rigid Grasp-pose Registration

要約

人間の知能の特徴であるツールの使用は、複雑な接触と高次元の動作空間により、ロボット工学において依然として困難な問題です。
この研究では、ツール使用行動の強化学習を可能にする新しい方法を紹介します。
私たちのアプローチは、1 回のデモン​​ストレーションだけを使用して、新しいカテゴリのツールの操作を学習するためのスケーラブルな方法を提供します。
この目的を達成するために、我々は、多指ロボットハンドの把持構成を新しい物体に一般化するための新しい方法を提案する。
これは、有利な初期化と整形された報酬シグナルを介してポリシー検索をガイドするために使用されます。
学習されたポリシーは、複雑なツール使用タスクを解決し、テスト時に目に見えないツールに一般化されます。
トレーニングされたポリシーの視覚化とビデオは、https://maltemosbach.github.io/generalizable_tool_use で入手できます。

要約(オリジナル)

Tool use, a hallmark feature of human intelligence, remains a challenging problem in robotics due the complex contacts and high-dimensional action space. In this work, we present a novel method to enable reinforcement learning of tool use behaviors. Our approach provides a scalable way to learn the operation of tools in a new category using only a single demonstration. To this end, we propose a new method for generalizing grasping configurations of multi-fingered robotic hands to novel objects. This is used to guide the policy search via favorable initializations and a shaped reward signal. The learned policies solve complex tool use tasks and generalize to unseen tools at test time. Visualizations and videos of the trained policies are available at https://maltemosbach.github.io/generalizable_tool_use.

arxiv情報

著者 Malte Mosbach,Sven Behnke
発行日 2023-07-31 08:49:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO パーマリンク