Jacta: A Versatile Planner for Learning Dexterous and Whole-body Manipulation

要約

ロボットの操作は、不連続なダイナミクスや高次元の状態・行動空間のために困難である。操作タスクに成功するデータ駆動型アプローチには、大量のデータと専門家によるデモンストレーション(通常は人間による)が必要である。既存のマニピュレーションプランナーは、特定のシステムに限定されており、多くの場合、デモンストレーションを利用するための特殊なアルゴリズムに依存している。そこで我々は、器用な全身操作タスクに合わせた柔軟な動作プランナーを紹介する。我々のプランナーは、強化学習アルゴリズムに容易に利用可能なデモンストレーションを作成し、追加的な学習パイプラインの複雑さを排除する。このアプローチにより、従来の強化学習だけではほとんど進まない複雑な操作タスクの方針を効率的に学習することができる。さらに、学習された方針は、複雑な器用な操作タスクを解決するための実際のロボットシステムに移植可能であることを実証する。

要約(オリジナル)

Robotic manipulation is challenging due to discontinuous dynamics, as well as high-dimensional state and action spaces. Data-driven approaches that succeed in manipulation tasks require large amounts of data and expert demonstrations, typically from humans. Existing manipulation planners are restricted to specific systems and often depend on specialized algorithms for using demonstration. Therefore, we introduce a flexible motion planner tailored to dexterous and whole-body manipulation tasks. Our planner creates readily usable demonstrations for reinforcement learning algorithms, eliminating the need for additional training pipeline complexities. With this approach, we can efficiently learn policies for complex manipulation tasks, where traditional reinforcement learning alone only makes little progress. Furthermore, we demonstrate that learned policies are transferable to real robotic systems for solving complex dexterous manipulation tasks.

arxiv情報

著者 Jan Brüdigam,Ali-Adeeb Abbas,Maks Sorokin,Kuan Fang,Brandon Hung,Maya Guru,Stefan Sosnowski,Jiuguang Wang,Sandra Hirche,Simon Le Cleac’h
発行日 2024-08-02 13:28:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.RO パーマリンク