PALo: Learning Posture-Aware Locomotion for Quadruped Robots

要約

具体化された知性の急速な発展に伴い、複雑な地形での四足ロボットの移動制御が研究ホットスポットになりました。
速度追跡のみに焦点を当てた従来の移動制御アプローチとは異なり、私たちは、多様で複雑な地形の四足ロボットの俊敏性と堅牢性のバランスをとることを追求します。
この目的のために、私たちは、パロという名前の姿勢認識運動のためのエンドツーエンドの深い強化学習フレームワークを提案します。パロは、体の高さ、ピッチ、ロール角の同時線形および角速度追跡とリアルタイム調整を処理することができます。
Paloでは、運動制御の問題は部分的に観察可能なマルコフ決定プロセスとして策定され、SIMからリアルの課題を克服するために、非対称のアクターcriticアーキテクチャが採用されています。
さらに、カスタマイズされたトレーニングカリキュラムを組み込むことにより、Paloはシミュレートされた環境でアジャイルな姿勢を意識した移動制御を達成し、微調整せずに現実世界の設定に成功裏に転送し、四足込まれたロボットの移動と体の姿勢をリアルタイムで制御できるようにします。
詳細な実験分析を通じて、パフォーマンスに寄与するPaloの重要なコンポーネントを特定し、提案された方法の有効性をさらに検証します。
この研究の結果は、高次元のコマンドスペースにある四足ロボットの低レベルの移動制御の新しい可能性を提供し、具体化された知性のための上位レベルモジュールに関する将来の研究の基礎を築きます。

要約(オリジナル)

With the rapid development of embodied intelligence, locomotion control of quadruped robots on complex terrains has become a research hotspot. Unlike traditional locomotion control approaches focusing solely on velocity tracking, we pursue to balance the agility and robustness of quadruped robots on diverse and complex terrains. To this end, we propose an end-to-end deep reinforcement learning framework for posture-aware locomotion named PALo, which manages to handle simultaneous linear and angular velocity tracking and real-time adjustments of body height, pitch, and roll angles. In PALo, the locomotion control problem is formulated as a partially observable Markov decision process, and an asymmetric actor-critic architecture is adopted to overcome the sim-to-real challenge. Further, by incorporating customized training curricula, PALo achieves agile posture-aware locomotion control in simulated environments and successfully transfers to real-world settings without fine-tuning, allowing real-time control of the quadruped robot’s locomotion and body posture across challenging terrains. Through in-depth experimental analysis, we identify the key components of PALo that contribute to its performance, further validating the effectiveness of the proposed method. The results of this study provide new possibilities for the low-level locomotion control of quadruped robots in higher dimensional command spaces and lay the foundation for future research on upper-level modules for embodied intelligence.

arxiv情報

著者 Xiangyu Miao,Jun Sun,Hang Lai,Xinpeng Di,Jiahang Cao,Yong Yu,Weinan Zhang
発行日 2025-03-06 14:13:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO パーマリンク