要約
この研究では、さまざまな四足歩行プラットフォームにわたってゼロショット一般化が可能な普遍的な移動制御ポリシーを開発するためのメタ強化学習アプローチを紹介します。
提案された方法は、手続き的に生成された四足ロボットの小さなセットを使用して、基準動作を模倣するように記憶ユニットを備えた RL エージェントを訓練します。
包括的なシミュレーションと実際のハードウェア実験を通じて、ロボット固有の微調整を必要とせずにさまざまなロボット間で移動を実現するアプローチの有効性を実証します。
さらに、一般化を可能にし、ロボット特性の変化への迅速な適応を促進し、サンプル効率を向上させる上でのメモリユニットの重要な役割を強調します。
要約(オリジナル)
This work presents a meta-reinforcement learning approach to develop a universal locomotion control policy capable of zero-shot generalization across diverse quadrupedal platforms. The proposed method trains an RL agent equipped with a memory unit to imitate reference motions using a small set of procedurally generated quadruped robots. Through comprehensive simulation and real-world hardware experiments, we demonstrate the efficacy of our approach in achieving locomotion across various robots without requiring robot-specific fine-tuning. Furthermore, we highlight the critical role of the memory unit in enabling generalization, facilitating rapid adaptation to changes in the robot properties, and improving sample efficiency.
arxiv情報
著者 | Fatemeh Zargarbashi,Fabrizio Di Giuro,Jin Cheng,Dongho Kang,Bhavya Sukhija,Stelian Coros |
発行日 | 2024-11-04 14:14:01+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google