HiFAR: Multi-Stage Curriculum Learning for High-Dynamics Humanoid Fall Recovery

要約

ヒューマノイドロボットは、特に動的および非構造化されていない環境内で、滝から自律的に回復するのにかなりの困難に遭遇します。
従来の制御方法論は、高次元のダイナミクスに関連する複雑さと、秋の回復の接触が豊富な性質に対処するには不十分なことがよくあります。
一方、強化学習手法は、まばらな報酬、複雑な衝突シナリオ、およびシミュレーションと現実世界のアプリケーションの間の矛盾に関連する問題によって妨げられています。
この研究では、Hifarと呼ばれるマルチステージカリキュラム学習フレームワークを紹介します。
このフレームワークは、ますます複雑で高次元の回復タスクを徐々に組み込んだ段階的な学習アプローチを採用しており、それにより、ロボットが効率的で安定した転倒回復戦略の獲得を促進します。
さらに、ロボットは、現実世界の秋のインシデントを効果的に管理するためにポリシーを適応させることができます。
実際のヒューマノイドロボットを使用して提案された方法の有効性を評価し、高い成功率、迅速な回復時間、堅牢性、一般化を伴う多様な転倒から自律的に回復する能力を示します。

要約(オリジナル)

Humanoid robots encounter considerable difficulties in autonomously recovering from falls, especially within dynamic and unstructured environments. Conventional control methodologies are often inadequate in addressing the complexities associated with high-dimensional dynamics and the contact-rich nature of fall recovery. Meanwhile, reinforcement learning techniques are hindered by issues related to sparse rewards, intricate collision scenarios, and discrepancies between simulation and real-world applications. In this study, we introduce a multi-stage curriculum learning framework, termed HiFAR. This framework employs a staged learning approach that progressively incorporates increasingly complex and high-dimensional recovery tasks, thereby facilitating the robot’s acquisition of efficient and stable fall recovery strategies. Furthermore, it enables the robot to adapt its policy to effectively manage real-world fall incidents. We assess the efficacy of the proposed method using a real humanoid robot, showcasing its capability to autonomously recover from a diverse range of falls with high success rates, rapid recovery times, robustness, and generalization.

arxiv情報

著者 Penghui Chen,Yushi Wang,Changsheng Luo,Wenhan Cai,Mingguo Zhao
発行日 2025-02-27 13:03:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク