Learning Humanoid Locomotion with Perceptive Internal Model

要約

「ブラインド」ポリシーを使用してさまざまな地形を移動できる四足ロボットとは対照的に、人型ロボットは自由度が高く、本質的に不安定な形態のため、安定した移動のために正確な認識が必要です。
ただし、知覚信号を組み込むとシステムに追加の外乱が生じることが多く、その堅牢性、汎用性、効率が低下する可能性があります。
この論文では、周囲を認識するためにロボットを中心としたオンボードの継続的に更新される標高マップに依存する知覚内部モデル (PIM) について説明します。
シミュレーションでロボット周囲のグラウンドトゥルースの障害物の高さを使用してポリシーをトレーニングし、ハイブリッド内部モデル (HIM) に基づいて最適化し、構築された標高マップからサンプリングされた高さを使用して推論を実行します。
深度マップや生の点群を直接エンコードする以前の方法とは異なり、私たちのアプローチにより、ロボットは足元の地形を明確に認識できるようになり、カメラの動きやノイズの影響が少なくなります。
さらに、シミュレーションでは深度マップのレンダリングが必要ないため、この方法では追加の計算コストが最小限に抑えられ、RTX 4090 GPU で 3 時間でポリシーをトレーニングできます。
私たちは、さまざまな人型ロボット、さまざまな屋内および屋外の地形、階段、さまざまなセンサー構成にわたってこの方法の有効性を検証します。
私たちの手法は、ヒューマノイドロボットが連続的に階段を登ることを可能にし、将来のヒューマノイド制御手法の開発のための基礎的なアルゴリズムとして機能する可能性があります。

要約(オリジナル)

In contrast to quadruped robots that can navigate diverse terrains using a ‘blind’ policy, humanoid robots require accurate perception for stable locomotion due to their high degrees of freedom and inherently unstable morphology. However, incorporating perceptual signals often introduces additional disturbances to the system, potentially reducing its robustness, generalizability, and efficiency. This paper presents the Perceptive Internal Model (PIM), which relies on onboard, continuously updated elevation maps centered around the robot to perceive its surroundings. We train the policy using ground-truth obstacle heights surrounding the robot in simulation, optimizing it based on the Hybrid Internal Model (HIM), and perform inference with heights sampled from the constructed elevation map. Unlike previous methods that directly encode depth maps or raw point clouds, our approach allows the robot to perceive the terrain beneath its feet clearly and is less affected by camera movement or noise. Furthermore, since depth map rendering is not required in simulation, our method introduces minimal additional computational costs and can train the policy in 3 hours on an RTX 4090 GPU. We verify the effectiveness of our method across various humanoid robots, various indoor and outdoor terrains, stairs, and various sensor configurations. Our method can enable a humanoid robot to continuously climb stairs and has the potential to serve as a foundational algorithm for the development of future humanoid control methods.

arxiv情報

著者 Junfeng Long,Junli Ren,Moji Shi,Zirui Wang,Tao Huang,Ping Luo,Jiangmiao Pang
発行日 2024-11-21 18:21:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク