Humanoid Whole-Body Locomotion on Narrow Terrain via Dynamic Balance and Reinforcement Learning

要約

人間は、多様な地形全体および極端な条件下で安定性を維持できるようにする繊細な動的バランスメカニズムを持っています。
ただし、最近の大きな進歩にもかかわらず、ヒューマノイドロボットの既存の移動アルゴリズムは、特に外部の知覚(視覚やLIDARなど)を欠く場合に、極端な環境を横断するのに苦労しています。
これは、現在の方法が歩行ベースまたは知覚条件の報酬に依存していることが多く、観察できない障害と突然のバランスの損失を処理するための効果的なメカニズムがないためです。
この課題に対処するために、ヒューマノイドロボットが極端な地形、特に狭い経路と予期せぬ障害を通過することを可能にする動的バランスと強化学習(RL)に基づいた新しい全身運動アルゴリズムを提案します。
具体的には、上部と下肢の調整されたアクションを達成することを目的とした全身俳優 – 批判的なフレームワークにおけるゼロモーメントポイント(ZMP)駆動型の報酬とタスク駆動型報酬の拡張尺度を活用することにより、動的バランスメカニズムを導入します。
堅牢な移動のため。
フルサイズのUnitree H1-2ロボットで実施された実験は、非常に狭い地形と外障害の下でバランスを維持する方法の能力を検証し、複雑な環境に対するロボットの適応性を高める上でその有効性を示しています。
ビデオはhttps://whole-body-loco.github.ioで提供されています。

要約(オリジナル)

Humans possess delicate dynamic balance mechanisms that enable them to maintain stability across diverse terrains and under extreme conditions. However, despite significant advances recently, existing locomotion algorithms for humanoid robots are still struggle to traverse extreme environments, especially in cases that lack external perception (e.g., vision or LiDAR). This is because current methods often rely on gait-based or perception-condition rewards, lacking effective mechanisms to handle unobservable obstacles and sudden balance loss. To address this challenge, we propose a novel whole-body locomotion algorithm based on dynamic balance and Reinforcement Learning (RL) that enables humanoid robots to traverse extreme terrains, particularly narrow pathways and unexpected obstacles, using only proprioception. Specifically, we introduce a dynamic balance mechanism by leveraging an extended measure of Zero-Moment Point (ZMP)-driven rewards and task-driven rewards in a whole-body actor-critic framework, aiming to achieve coordinated actions of the upper and lower limbs for robust locomotion. Experiments conducted on a full-sized Unitree H1-2 robot verify the ability of our method to maintain balance on extremely narrow terrains and under external disturbances, demonstrating its effectiveness in enhancing the robot’s adaptability to complex environments. The videos are given at https://whole-body-loco.github.io.

arxiv情報

著者 Weiji Xie,Chenjia Bai,Jiyuan Shi,Junkai Yang,Yunfei Ge,Weinan Zhang,Xuelong Li
発行日 2025-02-24 14:53:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO パーマリンク