要約
困難な環境における汎用ナビゲーションはロボット工学における重大な問題のままであり、現在の最先端のアプローチは無数の制限に直面しています。
古典的なアプローチは、乱雑な設定に苦労し、大規模な調整が必要ですが、学習ベースの手法は、配布外の環境に一般化することが困難に直面しています。
このペーパーでは、3 つの重要なアイデアを活用して既存の課題を克服する、エンドツーエンドの汎用ナビゲーション モデルである X-Mobility を紹介します。
まず、X-Mobility は、潜在状態空間を備えた自動回帰世界モデリング アーキテクチャを採用して、世界のダイナミクスをキャプチャします。
第 2 に、マルチヘッド デコーダの多様なセットにより、モデルは効果的なナビゲーション スキルと強く相関する豊富な状態表現を学習できます。
第三に、ワールド モデリングをアクション ポリシーから切り離すことにより、私たちのアーキテクチャは、エキスパート ポリシーの有無にかかわらず、さまざまなデータ ソースで効果的にトレーニングできます。オフポリシー データによりモデルは世界のダイナミクスを学習できる一方、監視制御を備えたオンポリシー データにより、
最適な行動方針の学習。
広範な実験を通じて、X-Mobility が効果的に一般化するだけでなく、現在の最先端のナビゲーション アプローチを超えることを実証しました。
さらに、X-Mobility はゼロショット Sim2Real 転送可能性も達成しており、クロス実施形態の一般化の強力な可能性を示しています。
要約(オリジナル)
General-purpose navigation in challenging environments remains a significant problem in robotics, with current state-of-the-art approaches facing myriad limitations. Classical approaches struggle with cluttered settings and require extensive tuning, while learning-based methods face difficulties generalizing to out-of-distribution environments. This paper introduces X-Mobility, an end-to-end generalizable navigation model that overcomes existing challenges by leveraging three key ideas. First, X-Mobility employs an auto-regressive world modeling architecture with a latent state space to capture world dynamics. Second, a diverse set of multi-head decoders enables the model to learn a rich state representation that correlates strongly with effective navigation skills. Third, by decoupling world modeling from action policy, our architecture can train effectively on a variety of data sources, both with and without expert policies: off-policy data allows the model to learn world dynamics, while on-policy data with supervisory control enables optimal action policy learning. Through extensive experiments, we demonstrate that X-Mobility not only generalizes effectively but also surpasses current state-of-the-art navigation approaches. Additionally, X-Mobility also achieves zero-shot Sim2Real transferability and shows strong potential for cross-embodiment generalization.
arxiv情報
著者 | Wei Liu,Huihua Zhao,Chenran Li,Joydeep Biswas,Billy Okal,Pulkit Goyal,Yan Chang,Soha Pouya |
発行日 | 2024-10-23 01:11:29+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google