LLM A*: Human in the Loop Large Language Models Enabled A* Search for Robotics

要約

本研究では、大規模言語モデル(Large Language Models: LLM)が、ロボットのような移動体型エージェントのパスプランニングを、ヒューマン・イン・ザ・ループ(human-in-the-loop)かつインタラクティブな方法でどのように支援できるかに焦点を当てる。LLM A*と名付けられた新しいフレームワークは、LLMのコモンセンスを活用することを目的とし、少数ショットで最適に近い経路計画を容易にするための効用最適A*を提案する。プロンプトは、1) LLMに環境、コスト、ヒューリスティックなどの重要な情報を提供し、2) LLMに中間計画結果に対する人間のフィードバックを伝えるために使用される。これにより、経路計画プロセス全体が「ホワイトボックス」となり、強化学習ベース(RL)の経路計画のような他のデータ駆動型手法と比較して、人間のフィードバックがLLM A*を迅速に収束に導く。さらに、LLM A*はコードフリーの経路計画を実用的なものにし、人工知能技術の包括性を促進する。A*とRLとの比較分析により、LLM A*は探索空間の点でより効率的であり、A*と同等の経路を達成し、RLよりも優れた経路を達成することが示された。また、LLM A*の対話的な性質は、人間とロボットの協調作業への展開を有望なものとする。

要約(オリジナル)

This research focuses on how Large Language Models (LLMs) can help with path planning for mobile embodied agents such as robots, in a human-in-the-loop and interactive manner. A novel framework named LLM A*, aims to leverage the commonsense of LLMs, and the utility-optimal A* is proposed to facilitate few-shot near-optimal path planning. Prompts are used to 1) provide LLMs with essential information like environment, cost, heuristics, etc.; 2) communicate human feedback to LLMs on intermediate planning results. This makes the whole path planning process a `white box’ and human feedback guides LLM A* to converge quickly compared to other data-driven methods such as reinforcement learning-based (RL) path planning. In addition, it makes code-free path planning practical, henceforth promoting the inclusiveness of artificial intelligence techniques. Comparative analysis against A* and RL shows that LLM A* is more efficient in terms of search space and achieves an on-a-par path with A* and a better path than RL. The interactive nature of LLM A* also makes it a promising tool for deployment in collaborative human-robot tasks.

arxiv情報

著者 Hengjia Xiao,Peng Wang
発行日 2023-12-04 10:37:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.HC, cs.RO パーマリンク