The Development of LLMs for Embodied Navigation


近年、Generative Pre-trained Transformer (GPT) などの大規模言語モデル (LLM) の急速な進歩は、さまざまな実際のアプリケーションでの可能性があるため、ますます注目を集めています。
身体化されたインテリジェンスを備えた LLM のアプリケーションが、重要な焦点分野として浮上しています。
LLM の無数のアプリケーションの中でも、ナビゲーション タスクは環境の深い理解と迅速かつ正確な意思決定を必要とするため、特に注目に値します。
LLM は、堅牢な言語と画像処理機能を活用して、高度な環境認識と意思決定のサポートによって身体化されたインテリジェンス システムを強化できます。
この記事では、ナビゲーションに焦点を当てて、LLM と身体化された知能の共生について徹底的に要約します。
最先端のモデル、研究方法をレビューし、既存の具体化されたナビゲーション モデルとデータセットの長所と短所を評価します。
最後に、この記事では、現在の研究に基づいて、身体化されたインテリジェンスにおける LLM の役割を説明し、この分野の将来の方向性を予測します。
この調査の包括的な研究リストは、 で入手できます。


In recent years, the rapid advancement of Large Language Models (LLMs) such as the Generative Pre-trained Transformer (GPT) has attracted increasing attention due to their potential in a variety of practical applications. The application of LLMs with Embodied Intelligence has emerged as a significant area of focus. Among the myriad applications of LLMs, navigation tasks are particularly noteworthy because they demand a deep understanding of the environment and quick, accurate decision-making. LLMs can augment embodied intelligence systems with sophisticated environmental perception and decision-making support, leveraging their robust language and image-processing capabilities. This article offers an exhaustive summary of the symbiosis between LLMs and embodied intelligence with a focus on navigation. It reviews state-of-the-art models, research methodologies, and assesses the advantages and disadvantages of existing embodied navigation models and datasets. Finally, the article elucidates the role of LLMs in embodied intelligence, based on current research, and forecasts future directions in the field. A comprehensive list of studies in this survey is available at


著者 Jinzhou Lin,Han Gao,Rongtao Xu,Changwei Wang,Li Guo,Shibiao Xu
発行日 2023-11-01 14:08:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI パーマリンク