要約
ヒューマノイドロボットは、人間のような移動と知覚能力を必要とする人間に遭遇するものに似た地形をナビゲートするように設計されています。
現在、ヒューマノイド運動の最も信頼性の高いコントローラーは、頑丈な地形に対処するときに危険で信頼できない信頼である固有受容にのみ依存しています。
高さマップを知覚に統合すると、プロアクティブな歩行計画が可能になりますが、この情報の堅牢な利用は、特に外観の知覚がうるさい場合、依然として重要な課題のままです。
これらの課題を乗り越えるために、教師と学生の蒸留フレームワークに基づいた解決策を提案します。
このパラダイムでは、Oracleポリシーはノイズのないデータにアクセスして最適な参照ポリシーを確立しますが、学生ポリシーは教師の行動を模倣するだけでなく、同時にセンサーの除去と状態の推定用の変分情報ボトルネックを使用して世界モデルを訓練します。
広範な評価は、私たちのアプローチが信頼できない地形の推定を特徴とするシナリオのパフォーマンスを著しく向上させることを示しています。
さらに、私たちは挑戦的な都市環境とオフロード環境の両方で厳格なテストを実施しました。モデルは、外部介入なしに2 kmのさまざまな地形を正常に通過しました。
要約(オリジナル)
Humanoid robots are engineered to navigate terrains akin to those encountered by humans, which necessitates human-like locomotion and perceptual abilities. Currently, the most reliable controllers for humanoid motion rely exclusively on proprioception, a reliance that becomes both dangerous and unreliable when coping with rugged terrain. Although the integration of height maps into perception can enable proactive gait planning, robust utilization of this information remains a significant challenge, especially when exteroceptive perception is noisy. To surmount these challenges, we propose a solution based on a teacher-student distillation framework. In this paradigm, an oracle policy accesses noise-free data to establish an optimal reference policy, while the student policy not only imitates the teacher’s actions but also simultaneously trains a world model with a variational information bottleneck for sensor denoising and state estimation. Extensive evaluations demonstrate that our approach markedly enhances performance in scenarios characterized by unreliable terrain estimations. Moreover, we conducted rigorous testing in both challenging urban settings and off-road environments, the model successfully traverse 2 km of varied terrain without external intervention.
arxiv情報
著者 | Wandong Sun,Baoshi Cao,Long Chen,Yongbo Su,Yang Liu,Zongwu Xie,Hong Liu |
発行日 | 2025-03-05 08:21:44+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google