Learning Agility and Adaptive Legged Locomotion via Curricular Hindsight Reinforcement Learning

要約

落下からの回復、高速旋回、野生下での全力疾走などの機敏で適応的な操作は、脚式システムにとっては困難です。
我々は、脚式ロボットの強力な敏捷性と適応を実現するエンドツーエンドの追跡コントローラーを学習するカリキュラム後知恵強化学習 (CHRL) を提案します。
2 つの重要なコンポーネントは、(I) タスクの難易度に関する新しい自動カリキュラム戦略、および (ii) 脚を使った移動タスクに適応した後知恵エクスペリエンス リプレイ戦略です。
私たちは、自律的に落下からの回復、コヒーレントな速歩、屋外での最大 3.45 m/s の持続速度、および最大 3.2 rad/s の調整速度を実行する本物の四足ロボットで機敏で適応的な移動に成功することを実証しました。
このシステムは、草や土などの自然地形での状況の変化や予期せぬ妨害に応じて適応的な行動を生み出します。

要約(オリジナル)

Agile and adaptive maneuvers such as fall recovery, high-speed turning, and sprinting in the wild are challenging for legged systems. We propose a Curricular Hindsight Reinforcement Learning (CHRL) that learns an end-to-end tracking controller that achieves powerful agility and adaptation for the legged robot. The two key components are (I) a novel automatic curriculum strategy on task difficulty and (ii) a Hindsight Experience Replay strategy adapted to legged locomotion tasks. We demonstrated successful agile and adaptive locomotion on a real quadruped robot that performed fall recovery autonomously, coherent trotting, sustained outdoor speeds up to 3.45 m/s, and tuning speeds up to 3.2 rad/s. This system produces adaptive behaviours responding to changing situations and unexpected disturbances on natural terrains like grass and dirt.

arxiv情報

著者 Sicen Li,Yiming Pang,Panju Bai,Zhaojin Liu,Jiawei Li,Shihao Hu,Liquan Wang,Gang Wang
発行日 2023-10-24 07:48:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク