要約
脚のロボットの動的な移動は、モバイルロボットの運用範囲を拡大する上で重要でありながら挑戦的なトピックです。
可能性のある足場がまばらであり、不確実性や障害に対する堅牢性、および多様な地形全体の一般化可能性がある場合、正確な計画が必要です。
従来のモデルベースのコントローラーは、複雑な地形の計画に優れていますが、実際の不確実性と格闘しています。
学習ベースのコントローラーは、そのような不確実性に堅牢性を提供しますが、段階的な領域がまばらな地形の正確さを欠いていることがよくあります。
ハイブリッド方法は、両方の方法を組み合わせることにより、まばらな地形の堅牢性の向上を実現しますが、モデルベースのプランナーの固有の制限によって計算的に要求され、制約されています。
学習ベースのコントローラーの堅牢性を維持しながら、多様な地形で一般化された脚のある脚の移動を達成するために、このペーパーでは、強化学習を使用してエンドツーエンドコントローラーの一部として訓練されているロボット固有受容を条件とする注意ベースのマップエンコードを学習することを提案します。
ロボットが多様で挑戦的な地形を動的にナビゲートするときに、ネットワークが将来の足場の段階的なエリアに焦点を合わせることを学ぶことを示します。
私たちは、まばらな地形の正確で機敏な横断を可能にしながら、不確実性に対して堅牢性を示す行動を合成します。
さらに、この方法では、ニューラルネットワークの地形認識を解釈する方法を提供します。
12ドーフのQuadrupedalロボットと23ドフのヒューマノイドロボットの2つのコントローラーをそれぞれトレーニングし、トレーニング中に見えないものを含むさまざまな挑戦的な屋内および屋外シナリオの下で、現実世界の結果として得られるコントローラーをテストしました。
要約(オリジナル)
Dynamic locomotion of legged robots is a critical yet challenging topic in expanding the operational range of mobile robots. It requires precise planning when possible footholds are sparse, robustness against uncertainties and disturbances, and generalizability across diverse terrains. While traditional model-based controllers excel at planning on complex terrains, they struggle with real-world uncertainties. Learning-based controllers offer robustness to such uncertainties but often lack precision on terrains with sparse steppable areas. Hybrid methods achieve enhanced robustness on sparse terrains by combining both methods but are computationally demanding and constrained by the inherent limitations of model-based planners. To achieve generalized legged locomotion on diverse terrains while preserving the robustness of learning-based controllers, this paper proposes to learn an attention-based map encoding conditioned on robot proprioception, which is trained as part of the end-to-end controller using reinforcement learning. We show that the network learns to focus on steppable areas for future footholds when the robot dynamically navigates diverse and challenging terrains. We synthesize behaviors that exhibit robustness against uncertainties while enabling precise and agile traversal of sparse terrains. Additionally, our method offers a way to interpret the topographical perception of a neural network. We have trained two controllers for a 12-DoF quadrupedal robot and a 23-DoF humanoid robot respectively and tested the resulting controllers in the real world under various challenging indoor and outdoor scenarios, including ones unseen during training.
arxiv情報
著者 | Junzhe He,Chong Zhang,Fabian Jenelten,Ruben Grandia,Moritz BÄcher,Marco Hutter |
発行日 | 2025-06-11 10:38:59+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google