DeXtreme: Transfer of Agile In-hand Manipulation from Simulation to Reality

要約

最近の研究では、深層強化学習(RL)アルゴリズムが、多指操作の領域を含む複雑なロボット動作をシミュレーションで学習できることが実証されている。しかし、このようなモデルは、シミュレーションと現実のギャップにより、実世界に移行することが困難な場合がある。本論文では、a)擬人化されたロボットハンド上でロバストな器用な操作を行うことができる方針と、b)操作される物体の状態に関する信頼性の高いリアルタイム情報を提供するのに適したロバストな姿勢推定器を訓練するための我々の技術を紹介する。我々の方針は、シミュレーションにおいて様々な条件に適応するように訓練されている。その結果、我々のビジョンベースの方針は、同じ方向転換タスクにおいて、文献中の最良のビジョン方針を大幅に上回り、モーションキャプチャシステムを介して特権的な状態情報を与えられた方針と競合する。我々の研究は、多様なハードウェアとシミュレータのセットアップにおいて、そして我々のケースでは、Allegro HandとIsaac Gym GPUベースのシミュレーションにおいて、器用な操作のためのシム-トゥ-リアル転送の可能性を再確認している。さらに、研究者が一般的に入手可能で、手頃な価格のロボットハンドとカメラでこのような結果を達成する可能性を開いています。得られたポリシーのビデオや、実験やデモを含む補足情報は、https://dextreme.org/。

要約(オリジナル)

Recent work has demonstrated the ability of deep reinforcement learning (RL) algorithms to learn complex robotic behaviours in simulation, including in the domain of multi-fingered manipulation. However, such models can be challenging to transfer to the real world due to the gap between simulation and reality. In this paper, we present our techniques to train a) a policy that can perform robust dexterous manipulation on an anthropomorphic robot hand and b) a robust pose estimator suitable for providing reliable real-time information on the state of the object being manipulated. Our policies are trained to adapt to a wide range of conditions in simulation. Consequently, our vision-based policies significantly outperform the best vision policies in the literature on the same reorientation task and are competitive with policies that are given privileged state information via motion capture systems. Our work reaffirms the possibilities of sim-to-real transfer for dexterous manipulation in diverse kinds of hardware and simulator setups, and in our case, with the Allegro Hand and Isaac Gym GPU-based simulation. Furthermore, it opens up possibilities for researchers to achieve such results with commonly-available, affordable robot hands and cameras. Videos of the resulting policy and supplementary information, including experiments and demos, can be found at https://dextreme.org/

arxiv情報

著者 Ankur Handa,Arthur Allshire,Viktor Makoviychuk,Aleksei Petrenko,Ritvik Singh,Jingzhou Liu,Denys Makoviichuk,Karl Van Wyk,Alexander Zhurkevich,Balakumar Sundaralingam,Yashraj Narang,Jean-Francois Lafleche,Dieter Fox,Gavriel State
発行日 2024-01-02 22:33:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG, cs.RO パーマリンク