Toward a method for LLM-enabled Indoor Navigation

要約

屋内ナビゲーションは、複雑なレイアウト、GPSシグナルの欠如、アクセシビリティの懸念による独自の課題を提示します。
既存のソリューションは、多くの場合、リアルタイムの適応性とユーザー固有のニーズに苦しんでいます。
この作業では、大規模な言語モデル(LLM)、つまりChatGptの可能性を調査して、屋内マップ画像から自然なコンテキスト対応ナビゲーションの指示を生成します。
さまざまな現実世界の環境でテストケースを設計および評価し、空間レイアウトの解釈、ユーザーの制約の処理、および効率的なルートの計画におけるLLMの有効性を分析します。
私たちの調査結果は、パーソナライズされた屋内ナビゲーションをサポートするためのLLMSの可能性を示しています。平均52%の正しい適応症と最大62%です。
結果は、レイアウトの複雑さや予想されるパスの複雑さに依存するのではなく、関心のあるポイントとパフォーマンスに悪影響を与える視覚情報の豊富さに依存するように見えます。

要約(オリジナル)

Indoor navigation presents unique challenges due to complex layouts, lack of GPS signals, and accessibility concerns. Existing solutions often struggle with real-time adaptability and user-specific needs. In this work, we explore the potential of a Large Language Model (LLM), i.e., ChatGPT, to generate natural, context-aware navigation instructions from indoor map images. We design and evaluate test cases across different real-world environments, analyzing the effectiveness of LLMs in interpreting spatial layouts, handling user constraints, and planning efficient routes. Our findings demonstrate the potential of LLMs for supporting personalized indoor navigation, with an average of 52% correct indications and a maximum of 62%. The results do not appear to depend on the complexity of the layout or the complexity of the expected path, but rather on the number of points of interest and the abundance of visual information, which negatively affect the performance.

arxiv情報

著者 Alberto Coffrini,Mohammad Amin Zadenoori,Paolo Barsocchi,Francesco Furfari,Antonino Crivello,Alessio Ferrari
発行日 2025-03-21 16:17:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.LG パーマリンク