要約
車輪脚ロボットにロボットマニピュレータを組み込むことで俊敏性が向上し、実用化の可能性が広がります。
ただし、潜在的な不安定性や不確実性が存在すると、制御目標にさらなる課題が生じます。
この論文では、マニピュレーターの追加によって生じる問題に取り組むために、アームに制約のあるカリキュラム学習アーキテクチャを紹介します。
まず、制御性能の安全性と安定性を確保するためのアーム制約型強化学習アルゴリズムを開発します。
さらに、アームとベースの間の報酬設定の不一致に対処するために、報酬を意識したカリキュラム学習方法を提案します。
このポリシーは最初にアイザック ジムで訓練され、物理的なロボットに転送されて、ドアを開けるタスク、扇風機を動かすタスク、リレーでバトンをピックしてフォローするタスクなど、動的につかむタスクを実行します。
結果は、私たちが提案したアプローチがアームを備えた車輪脚ロボットを効果的に制御して動的把握スキルを習得し、移動中に移動物体を追いかけて捕まえることができることを示しています。
コードと補足ビデオについては、当社の Web サイト (https://acodedog.github.io/wheel-legged-loco-manipulation) を参照してください。
要約(オリジナル)
Incorporating a robotic manipulator into a wheel-legged robot enhances its agility and expands its potential for practical applications. However, the presence of potential instability and uncertainties presents additional challenges for control objectives. In this paper, we introduce an arm-constrained curriculum learning architecture to tackle the issues introduced by adding the manipulator. Firstly, we develop an arm-constrained reinforcement learning algorithm to ensure safety and stability in control performance. Additionally, to address discrepancies in reward settings between the arm and the base, we propose a reward-aware curriculum learning method. The policy is first trained in Isaac gym and transferred to the physical robot to do dynamic grasping tasks, including the door-opening task, fan-twitching task and the relay-baton-picking and following task. The results demonstrate that our proposed approach effectively controls the arm-equipped wheel-legged robot to master dynamic grasping skills, allowing it to chase and catch a moving object while in motion. Please refer to our website (https://acodedog.github.io/wheel-legged-loco-manipulation) for the code and supplemental videos.
arxiv情報
著者 | Zifan Wang,Yufei Jia,Lu Shi,Haoyu Wang,Haizhou Zhao,Xueyang Li,Jinni Zhou,Jun Ma,Guyue Zhou |
発行日 | 2024-03-28 09:30:23+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google