A Learning Framework for Diverse Legged Robot Locomotion Using Barrier-Based Style Rewards

要約

この研究では、脚式ロボットの移動のためのさまざまな動作モード (四足、三脚、または二足) と多様なタスクを可能にするモデルフリーの強化学習フレームワークを導入します。
緩和された対数バリア関数に基づく動作スタイル報酬をソフト制約として採用し、歩行、足のクリアランス、関節の位置、身長などの目的の動作スタイルに向かって学習プロセスを偏らせます。
事前定義された歩行サイクルは柔軟な方法でエンコードされ、学習プロセス全体を通じて歩行の調整が容易になります。
広範な実験により、重量 45 kg のロボット システム KAIST HOUND が、提案されたフレームワークを使用して二足歩行、三足歩行、および四足歩行を実現できることが実証されました。
四足歩行の能力には、凹凸のある地形を横断し、4.67 m/s で疾走し、最大 58 cm (HOUND2 では 67 cm) の障害物を乗り越えることが含まれます。
二足歩行の能力には、秒速 3.6 m で走ること、7.5 kg の物体を運ぶこと、階段を昇ることが含まれますが、これらはすべて外受容入力なしで実行されます。

要約(オリジナル)

This work introduces a model-free reinforcement learning framework that enables various modes of motion (quadruped, tripod, or biped) and diverse tasks for legged robot locomotion. We employ a motion-style reward based on a relaxed logarithmic barrier function as a soft constraint, to bias the learning process toward the desired motion style, such as gait, foot clearance, joint position, or body height. The predefined gait cycle is encoded in a flexible manner, facilitating gait adjustments throughout the learning process. Extensive experiments demonstrate that KAIST HOUND, a 45 kg robotic system, can achieve biped, tripod, and quadruped locomotion using the proposed framework; quadrupedal capabilities include traversing uneven terrain, galloping at 4.67 m/s, and overcoming obstacles up to 58 cm (67 cm for HOUND2); bipedal capabilities include running at 3.6 m/s, carrying a 7.5 kg object, and ascending stairs-all performed without exteroceptive input.

arxiv情報

著者 Gijeong Kim,Yong-Hoon Lee,Hae-Won Park
発行日 2024-09-24 06:22:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク