要約
ヒューマノイドロボットは、強化学習(RL)ベースのアプローチを使用して、堅牢な運動機能を実証しています。
さらに、人間のような行動を取得するために、既存の方法は、RLフレームワークで先行する人間の動きトラッキングまたは動きを統合します。
ただし、これらの方法は、固有受容のみを備えたフラットな地形では制限されており、人間のような歩行で挑戦的な地形を横断する能力を制限しています。
この作業では、潜在的な残留専門家とマルチ分類の混合物を使用して、RLポリシーを訓練するための新しいフレームワークを提案します。RLポリシーを訓練します。
2段階のトレーニングパイプラインは、最初に深さカメラを使用して複雑な地形を通過するポリシーを教え、次に人間のような歩行パターンを歩き回ることを可能にします。
また、ロボットベースの高さなどの人間のような行動を調整するための歩行報酬を設計します。
シミュレーションと現実世界の実験は、私たちのフレームワークが複雑な地形を横断する並外れたパフォーマンスを示し、複数の人間のような歩行パターン間のシームレスな遷移を達成することを示しています。
要約(オリジナル)
Humanoid robots have demonstrated robust locomotion capabilities using Reinforcement Learning (RL)-based approaches. Further, to obtain human-like behaviors, existing methods integrate human motion-tracking or motion prior in the RL framework. However, these methods are limited in flat terrains with proprioception only, restricting their abilities to traverse challenging terrains with human-like gaits. In this work, we propose a novel framework using a mixture of latent residual experts with multi-discriminators to train an RL policy, which is capable of traversing complex terrains in controllable lifelike gaits with exteroception. Our two-stage training pipeline first teaches the policy to traverse complex terrains using a depth camera, and then enables gait-commanded switching between human-like gait patterns. We also design gait rewards to adjust human-like behaviors like robot base height. Simulation and real-world experiments demonstrate that our framework exhibits exceptional performance in traversing complex terrains, and achieves seamless transitions between multiple human-like gait patterns.
arxiv情報
著者 | Dewei Wang,Xinmiao Wang,Xinzhe Liu,Jiyuan Shi,Yingnan Zhao,Chenjia Bai,Xuelong Li |
発行日 | 2025-06-10 14:25:58+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google