Intelligent LiDAR Navigation: Leveraging External Information and Semantic Maps with LLM as Copilot


従来のロボット ナビゲーション システムは、ROS の人気のある move_base パッケージで実証されているように、占有グリッド マップとレーザーベースのセンシング テクノロジーを主に利用しています。
人間のパフォーマンスに近いテキスト理解と知能を備えたラージ言語モデル (LLM) の開発により、ロボット ナビゲーション システムに人間の認知に近いレベルの理解を注入する機会が生まれました。
この研究では、革新的なセマンティック トポメトリック階層マップ表現である osmAG (OpensStreetMap テキスト形式のエリア グラフ) を使用して、ROS move_base の機能と LLM によって提供されるコンテキスト理解の間のギャップを埋めることを提案します。
私たちの方法論では、LLM をロボット ナビゲーションの実際の副操縦士として採用し、従来のロボット ナビゲーション システムの堅牢性を維持しながら、より広範囲の情報入力の統合を可能にします。
コード、デモ、マップ、実験結果には、 からアクセスできます。


Traditional robot navigation systems primarily utilize occupancy grid maps and laser-based sensing technologies, as demonstrated by the popular move_base package in ROS. Unlike robots, humans navigate not only through spatial awareness and physical distances but also by integrating external information, such as elevator maintenance updates from public notification boards and experiential knowledge, like the need for special access through certain doors. With the development of Large Language Models (LLMs), which posses text understanding and intelligence close to human performance, there is now an opportunity to infuse robot navigation systems with a level of understanding akin to human cognition. In this study, we propose using osmAG (Area Graph in OpensStreetMap textual format), an innovative semantic topometric hierarchical map representation, to bridge the gap between the capabilities of ROS move_base and the contextual understanding offered by LLMs. Our methodology employs LLMs as actual copilot in robot navigation, enabling the integration of a broader range of informational inputs while maintaining the robustness of traditional robotic navigation systems. Our code, demo, map, experiment results can be accessed at


著者 Fujing Xie,Jiajie Zhang,Sören Schwertfeger
発行日 2024-09-13 02:37:28+00:00
