DexPBT: Scaling up Dexterous Manipulation for Hand-Arm Systems with Population Based Training


この研究では、多指のハンドエンドエフェクタを備えたシミュレートされた 1 つまたは 2 つ腕のロボットを使用して、器用な物体操作を学習できるアルゴリズムと方法を提案します。
並列 GPU で高速化された物理シミュレーター (Isaac Gym) を使用して、再把握、掴んで投げる、オブジェクトの向きの変更など、これらのロボットに困難なタスクを実装します。
これらの問題を解決するために、深層強化学習の探索能力を大幅に強化できる分散型人口ベース トレーニング (PBT) アルゴリズムを導入しました。
学習された行動とコードのビデオデモは、 でご覧いただけます。


In this work, we propose algorithms and methods that enable learning dexterous object manipulation using simulated one- or two-armed robots equipped with multi-fingered hand end-effectors. Using a parallel GPU-accelerated physics simulator (Isaac Gym), we implement challenging tasks for these robots, including regrasping, grasp-and-throw, and object reorientation. To solve these problems we introduce a decentralized Population-Based Training (PBT) algorithm that allows us to massively amplify the exploration capabilities of deep reinforcement learning. We find that this method significantly outperforms regular end-to-end learning and is able to discover robust control policies in challenging tasks. Video demonstrations of learned behaviors and the code can be found at


著者 Aleksei Petrenko,Arthur Allshire,Gavriel State,Ankur Handa,Viktor Makoviychuk
発行日 2023-05-20 07:25:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.RO パーマリンク