Embodied AI in Mobile Robots: Coverage Path Planning with Large Language Models

要約

近年、大規模言語モデル (LLM) は数学的問題の理解と解決において顕著な能力を実証し、さまざまな分野で進歩をもたらしています。
我々は、高レベルのカバレッジパス計画の問題と低レベルの制御の解決に焦点を当て、モバイルエージェント向けにLLMを組み込んだパス計画フレームワークを提案します。
私たちが提案する多層アーキテクチャでは、経路計画フェーズでプロンプト LLM を使用し、それらをモバイル エージェントの低レベル アクチュエータと統合します。
さまざまな LLM のパフォーマンスを評価するために、具体化されたモデルのパフォーマンスを評価するためのカバレッジ重み付けパス プランニング メトリックを提案します。
私たちの実験は、提案されたフレームワークが LLM の空間推論能力を向上させることを示しています。
提案された多層フレームワークが、LLM の自然言語理解と生成機能を活用することで、これらのタスクの効率と精度を大幅に向上させることを実証します。
私たちの実験は、このフレームワークが LLM の 2D 平面推論能力を向上させ、カバレッジ パス計画タスクを完了できることを示しています。
また、gpt-4o、gemini-1.5-flash、claude-3.5-sonnet の 3 つの LLM カーネルもテストしました。
実験結果は、claude-3.5 がさまざまなシナリオでカバレッジ計画タスクを完了でき、その指標が他のモデルの指標より優れていることを示しています。

要約(オリジナル)

In recent years, Large Language Models (LLMs) have demonstrated remarkable capabilities in understanding and solving mathematical problems, leading to advancements in various fields. We propose an LLM-embodied path planning framework for mobile agents, focusing on solving high-level coverage path planning issues and low-level control. Our proposed multi-layer architecture uses prompted LLMs in the path planning phase and integrates them with the mobile agents’ low-level actuators. To evaluate the performance of various LLMs, we propose a coverage-weighted path planning metric to assess the performance of the embodied models. Our experiments show that the proposed framework improves LLMs’ spatial inference abilities. We demonstrate that the proposed multi-layer framework significantly enhances the efficiency and accuracy of these tasks by leveraging the natural language understanding and generative capabilities of LLMs. Our experiments show that this framework can improve LLMs’ 2D plane reasoning abilities and complete coverage path planning tasks. We also tested three LLM kernels: gpt-4o, gemini-1.5-flash, and claude-3.5-sonnet. The experimental results show that claude-3.5 can complete the coverage planning task in different scenarios, and its indicators are better than those of the other models.

arxiv情報

著者 Xiangrui Kong,Wenxiao Zhang,Jin Hong,Thomas Braunl
発行日 2024-07-02 12:38:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク