Learning Humanoid Locomotion over Challenging Terrain

要約

ヒューマノイドロボットは、原理的には脚を使ってほとんどどこへでも行くことができる。しかし、多様な地形を横断できるコントローラを開発することは、依然として大きな課題である。古典的なコントローラは広く一般化することが難しく、学習ベースの手法は主になだらかな地形に焦点を当ててきた。本論文では、自然地形や人工地形を横断できるブラインドヒューマノイドロコモーションのための学習ベースのアプローチを紹介する。本手法では、固有知覚の観測と行動の履歴に基づいて次の行動を予測する変換モデルを用いる。このモデルは、まずシーケンスモデリングにより平坦な地面の軌跡のデータセットで事前学習され、次に強化学習により凹凸のある地形で微調整される。我々は、粗い路面、変形可能な路面、傾斜のある路面など、様々な地形にわたる実際のヒューマノイドロボットで我々のモデルを評価する。このモデルは、頑健な性能、文脈内適応、および創発的な地形表現を示す。実際のケーススタディにおいて、我々のヒューマノイドロボットは、バークレーにある4マイル以上のハイキングコースを横断し、サンフランシスコの最も急な通りのいくつかを登ることに成功した。

要約(オリジナル)

Humanoid robots can, in principle, use their legs to go almost anywhere. Developing controllers capable of traversing diverse terrains, however, remains a considerable challenge. Classical controllers are hard to generalize broadly while the learning-based methods have primarily focused on gentle terrains. Here, we present a learning-based approach for blind humanoid locomotion capable of traversing challenging natural and man-made terrain. Our method uses a transformer model to predict the next action based on the history of proprioceptive observations and actions. The model is first pre-trained on a dataset of flat-ground trajectories with sequence modeling, and then fine-tuned on uneven terrain using reinforcement learning. We evaluate our model on a real humanoid robot across a variety of terrains, including rough, deformable, and sloped surfaces. The model demonstrates robust performance, in-context adaptation, and emergent terrain representations. In real-world case studies, our humanoid robot successfully traversed over 4 miles of hiking trails in Berkeley and climbed some of the steepest streets in San Francisco.

arxiv情報

著者 Ilija Radosavovic,Sarthak Kamat,Trevor Darrell,Jitendra Malik
発行日 2024-10-04 17:57:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG, cs.RO パーマリンク