要約
日常生活用の汎用サービス ロボットの開発には、無数の基本的な動作を賢明に展開するロボットの能力が必要です。
大規模言語モデル (LLM) のトレーニングにおける最近の進歩を使用すると、追加のドメイン情報なしで自然言語で命令が与えられると、アクション シーケンスを直接生成できます。
ただし、LLM の出力は意味的には正しいものの、生成されたタスク プランは許容可能なアクションに正確にマッピングされていない可能性があり、さまざまな言語的曖昧さを含む可能性があります。
LLM 幻覚はロボットのタスク計画に別の課題をもたらし、その結果、現実世界の事実やユーザー入力と矛盾するコンテンツが生成されます。
本稿では、コマンドから実行可能なアクションシーケンスを生成できる、制約付きLLMプロンプトスキームに基づくタスク計画手法を提案します。
LLM 幻覚問題に対処するための例外的な処理モジュールがさらに提案されています。
このモジュールは、LLM によって生成された結果が現在の環境で許容できるものであることを確認できます。
RoboCup@Home コマンド ジェネレーターによって生成されたコマンドでメソッドを評価し、ロボットが指示の理解とタスクの実行の両方で優れたパフォーマンスを発揮することを観察しました。
要約(オリジナル)
The development of a general purpose service robot for daily life necessitates the robot’s ability to deploy a myriad of fundamental behaviors judiciously. Recent advancements in training Large Language Models (LLMs) can be used to generate action sequences directly, given an instruction in natural language with no additional domain information. However, while the outputs of LLMs are semantically correct, the generated task plans may not accurately map to acceptable actions and might encompass various linguistic ambiguities. LLM hallucinations pose another challenge for robot task planning, which results in content that is inconsistent with real-world facts or user inputs. In this paper, we propose a task planning method based on a constrained LLM prompt scheme, which can generate an executable action sequence from a command. An exceptional handling module is further proposed to deal with LLM hallucinations problem. This module can ensure the LLM-generated results are admissible in the current environment. We evaluate our method on the commands generated by the RoboCup@Home Command Generator, observing that the robot demonstrates exceptional performance in both comprehending instructions and executing tasks.
arxiv情報
著者 | Ruoyu Wang,Zhipeng Yang,Zinan Zhao,Xinyan Tong,Zhi Hong,Kun Qian |
発行日 | 2024-05-24 15:35:49+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google