Learning to Exploit Elastic Actuators for Quadruped Locomotion

要約

脚式移動のばねベースのアクチュエータは、エネルギー効率とパフォーマンスの向上を提供しますが、コントローラーの設計の難しさを増します。
以前の研究では、このようなシステムに最適なコントローラーを見つけるために広範なモデリングとシミュレーションに焦点を当てていましたが、モデルフリーのコントローラーを実際のロボットで直接学習することを提案します。
私たちのアプローチでは、歩行は最初に中央パターンジェネレーター (CPG) によって合成されます。CPG のパラメーターは、効率的な移動を実現する開ループコントローラーをすばやく取得するために最適化されます。
次に、このコントローラーをより堅牢にし、パフォーマンスをさらに向上させるために、強化学習を使用してループを閉じ、CPG の上で修正アクションを学習します。
DLR 弾性四足歩行ベルトで提案されたアプローチを評価します。
速歩とプロンキング歩行の学習における我々の結果は、スプリング アクチュエータのダイナミクスの活用が、動的な動きの最適化から自然に生じ、モデルがなくても高性能の移動をもたらすことを示しています。
プロセス全体は、実際のロボットで 1.5 時間もかからず、自然な歩行が得られます。

要約(オリジナル)

Spring-based actuators in legged locomotion provide energy-efficiency and improved performance, but increase the difficulty of controller design. While previous work has focused on extensive modeling and simulation to find optimal controllers for such systems, we propose to learn model-free controllers directly on the real robot. In our approach, gaits are first synthesized by central pattern generators (CPGs), whose parameters are optimized to quickly obtain an open-loop controller that achieves efficient locomotion. Then, to make this controller more robust and further improve the performance, we use reinforcement learning to close the loop, to learn corrective actions on top of the CPGs. We evaluate the proposed approach on the DLR elastic quadruped bert. Our results in learning trotting and pronking gaits show that exploitation of the spring actuator dynamics emerges naturally from optimizing for dynamic motions, yielding high-performing locomotion despite being model-free. The whole process takes no more than 1.5 hours on the real robot and results in natural-looking gaits.

arxiv情報

著者 Antonin Raffin,Daniel Seidel,Jens Kober,Alin Albu-Schäffer,João Silvério,Freek Stulp
発行日 2023-03-27 10:40:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO パーマリンク