要約
補強学習(RL)の最近の進歩により、ヒューマノイドロボットの移動が大幅に進歩し、シミュレーションにおけるモーションポリシーの設計とトレーニングが簡素化されました。
ただし、多数の実装の詳細により、これらのポリシーを実際のロボットに転送することは困難なタスクになります。
これに対処するために、トレーニングから展開までのプロセス全体をカバーする包括的なコードフレームワークを開発しました。一般的なRLトレーニング方法、ドメインランダム化、報酬機能設計、および並列構造を処理するためのソリューションを組み込みました。
このライブラリは、その設計と実験結果の詳細な説明を含むコミュニティリソースとして利用可能になります。
ブースターT1ロボットのフレームワークを検証し、訓練されたポリシーが物理プラットフォームにシームレスに転送され、全方向ウォーキング、障害抵抗、地形の適応性などの機能を可能にすることを実証します。
この作品がロボットコミュニティに便利なツールを提供し、ヒューマノイドロボットの開発を加速させることを願っています。
コードはhttps://github.com/boosterrobotics/booster_gymにあります。
要約(オリジナル)
Recent advancements in reinforcement learning (RL) have led to significant progress in humanoid robot locomotion, simplifying the design and training of motion policies in simulation. However, the numerous implementation details make transferring these policies to real-world robots a challenging task. To address this, we have developed a comprehensive code framework that covers the entire process from training to deployment, incorporating common RL training methods, domain randomization, reward function design, and solutions for handling parallel structures. This library is made available as a community resource, with detailed descriptions of its design and experimental results. We validate the framework on the Booster T1 robot, demonstrating that the trained policies seamlessly transfer to the physical platform, enabling capabilities such as omnidirectional walking, disturbance resistance, and terrain adaptability. We hope this work provides a convenient tool for the robotics community, accelerating the development of humanoid robots. The code can be found in https://github.com/BoosterRobotics/booster_gym.
arxiv情報
著者 | Yushi Wang,Penghui Chen,Xinyu Han,Feng Wu,Mingguo Zhao |
発行日 | 2025-06-18 04:24:49+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google