要約
この研究では、多指のハンドエンドエフェクタを備えたシミュレートされた 1 つまたは 2 つ腕のロボットを使用して、器用な物体操作を学習できるアルゴリズムと方法を提案します。
並列 GPU で高速化された物理シミュレーター (Isaac Gym) を使用して、再把握、掴んで投げる、オブジェクトの向きの変更など、これらのロボットに困難なタスクを実装します。
これらの問題を解決するために、深層強化学習の探索能力を大幅に強化できる分散型人口ベース トレーニング (PBT) アルゴリズムを導入しました。
この方法は通常のエンドツーエンド学習よりも大幅に優れており、困難なタスクにおいて堅牢な制御ポリシーを発見できることがわかりました。
学習された行動とコードのビデオデモは、https://sites.google.com/view/dexpbt でご覧いただけます。
要約(オリジナル)
In this work, we propose algorithms and methods that enable learning dexterous object manipulation using simulated one- or two-armed robots equipped with multi-fingered hand end-effectors. Using a parallel GPU-accelerated physics simulator (Isaac Gym), we implement challenging tasks for these robots, including regrasping, grasp-and-throw, and object reorientation. To solve these problems we introduce a decentralized Population-Based Training (PBT) algorithm that allows us to massively amplify the exploration capabilities of deep reinforcement learning. We find that this method significantly outperforms regular end-to-end learning and is able to discover robust control policies in challenging tasks. Video demonstrations of learned behaviors and the code can be found at https://sites.google.com/view/dexpbt
arxiv情報
著者 | Aleksei Petrenko,Arthur Allshire,Gavriel State,Ankur Handa,Viktor Makoviychuk |
発行日 | 2023-05-20 07:25:27+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google