Research on Navigation Methods Based on LLMs

要約

近年、屋内ナビゲーションの分野は、大規模な言語モデル(LLM)の統合を通じて画期的な進歩を目撃しています。
事前に構築されたマップまたは強化学習に依存する従来のナビゲーションアプローチは、一般化や動的環境への限定的な適応性などの制限を示しています。
対照的に、LLMは、例外的な意味理解、推論能力、およびゼロショット一般化プロパティを活用することにより、複雑な屋内ナビゲーションタスクの新しいパラダイムを提供します。
LLMを呼び出す機能を活用し、LLMを中央コントローラーとして配置するLLMベースのナビゲーションフレームワークを提案します。
私たちの方法論には、従来のナビゲーション関数を拡張可能な構成を備えた再利用可能なLLMツールへのモジュール式分解が含まれます。
これは、さまざまな実装にわたって簡単に適応できる体系的に設計された転送可能なシステムプロンプトテンプレートと相互作用ワークフローによって補完されます。
多様なシナリオにわたるpybulletシミュレーション環境での実験的検証は、特に動的ツール構成を通じてコン​​テキスト認識ナビゲーションを実現する際に、アプローチの実質的な潜在性と有効性を示しています。

要約(オリジナル)

In recent years, the field of indoor navigation has witnessed groundbreaking advancements through the integration of Large Language Models (LLMs). Traditional navigation approaches relying on pre-built maps or reinforcement learning exhibit limitations such as poor generalization and limited adaptability to dynamic environments. In contrast, LLMs offer a novel paradigm for complex indoor navigation tasks by leveraging their exceptional semantic comprehension, reasoning capabilities, and zero-shot generalization properties. We propose an LLM-based navigation framework that leverages function calling capabilities, positioning the LLM as the central controller. Our methodology involves modular decomposition of conventional navigation functions into reusable LLM tools with expandable configurations. This is complemented by a systematically designed, transferable system prompt template and interaction workflow that can be easily adapted across different implementations. Experimental validation in PyBullet simulation environments across diverse scenarios demonstrates the substantial potential and effectiveness of our approach, particularly in achieving context-aware navigation through dynamic tool composition.

arxiv情報

著者 Anlong Zhang,Jianmin Ji
発行日 2025-04-22 05:40:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY パーマリンク