ViPlanner: Visual Semantic Imperative Learning for Local Navigation

要約

屋外環境におけるリアルタイムの経路計画は、地形の通過性の違い、多様な障害物、迅速な意思決定の必要性などにより、現代のロボット システムにとって依然として課題となっています。
確立されたアプローチは、主に幾何学的なナビゲーション ソリューションに焦点を当ててきました。これは、構造化された幾何学的な障害物にはうまく機能しますが、さまざまな地形タイプとそのアフォーダンスの意味論的解釈に関して制限があります。
さらに、これらの方法では、階段などの通過可能な幾何学的存在を識別できません。
これらの問題を克服するために、幾何学的および意味論的な情報に基づいてローカル プランを生成する学習型ローカル パス プランニング アプローチである ViPlanner を導入します。
このシステムは、計画タスクの目的に基づいてネットワークの重みがエンドツーエンドで最適化される命令型学習パラダイムを使用してトレーニングされます。
この最適化では、セマンティック コストマップの微分可能な定式化を使用します。これにより、プランナーは、さまざまな地形の通過可能性を区別し、障害物を正確に識別できます。
セマンティック情報は、複数レベルの通過可能性を効果的にエンコードできる RGB カラースペースを使用して 30 のクラスで表現されます。
私たちは、プランナーが現実世界のトレーニングを必要とせずに、多様な現実世界の環境に適応できることを示します。
実際、プランナーは純粋にシミュレーションでトレーニングされるため、拡張性の高いトレーニング データの生成が可能になります。
実験結果は、純粋な幾何学ベースのアプローチと比較して、ノイズに対する耐性、ゼロショットのシミュレーションから実数への転送、および通過可能性コストの点で 38.02% の削減を示しています。
コードとモデルは、https://github.com/leggedrobotics/viplanner から公開されています。

要約(オリジナル)

Real-time path planning in outdoor environments still challenges modern robotic systems due to differences in terrain traversability, diverse obstacles, and the necessity for fast decision-making. Established approaches have primarily focused on geometric navigation solutions, which work well for structured geometric obstacles but have limitations regarding the semantic interpretation of different terrain types and their affordances. Moreover, these methods fail to identify traversable geometric occurrences, such as stairs. To overcome these issues, we introduce ViPlanner, a learned local path planning approach that generates local plans based on geometric and semantic information. The system is trained using the Imperative Learning paradigm, for which the network weights are optimized end-to-end based on the planning task objective. This optimization uses a differentiable formulation of a semantic costmap, which enables the planner to distinguish between the traversability of different terrains and accurately identify obstacles. The semantic information is represented in 30 classes using an RGB colorspace that can effectively encode the multiple levels of traversability. We show that the planner can adapt to diverse real-world environments without requiring any real-world training. In fact, the planner is trained purely in simulation, enabling a highly scalable training data generation. Experimental results demonstrate resistance to noise, zero-shot sim-to-real transfer, and a decrease of 38.02% in terms of traversability cost compared to purely geometric-based approaches. Code and models are made publicly available: https://github.com/leggedrobotics/viplanner.

arxiv情報

著者 Pascal Roth,Julian Nubert,Fan Yang,Mayank Mittal,Marco Hutter
発行日 2024-05-12 13:47:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク