要約
言語モデル(LMS)は、自然言語を理解するための強力な能力を備えており、人間の指示を単純なロボットタスクの詳細な計画に変換するのに効果的です。
それにもかかわらず、特に協同組合の異種ロボットチームのサブタスクの識別と割り当てにおいて、長老様式のタスクを処理することは重要な課題です。
この問題に対処するために、言語モデル駆動型のマルチエージェントPDDLプランナー(LAMMA-P)を提案します。これは、長距離タスクで最先端のパフォーマンスを達成する新しいマルチエージェントタスク計画フレームワークです。
LAMMA-Pは、LMSの推論能力と従来のヒューリスティック検索プランナーの強みを統合して、タスク全体で強力な一般化を実証しながら、高い成功率と効率を達成します。
さらに、AI2-THOR環境に基づいて2つの異なるレベルの複雑さを持つ家庭用タスクを備えた包括的なベンチマークであるMat-Thorを作成します。
実験結果は、LAMMA-Pが既存のLMベースのマルチエージェントプランナーよりも105%高い成功率と36%高い効率を達成することを示しています。
各モジュールで使用される実験ビデオ、コード、データセット、および詳細なプロンプトは、プロジェクトWebサイトhttps://lamma-p.github.ioで見つけることができます。
要約(オリジナル)
Language models (LMs) possess a strong capability to comprehend natural language, making them effective in translating human instructions into detailed plans for simple robot tasks. Nevertheless, it remains a significant challenge to handle long-horizon tasks, especially in subtask identification and allocation for cooperative heterogeneous robot teams. To address this issue, we propose a Language Model-Driven Multi-Agent PDDL Planner (LaMMA-P), a novel multi-agent task planning framework that achieves state-of-the-art performance on long-horizon tasks. LaMMA-P integrates the strengths of the LMs’ reasoning capability and the traditional heuristic search planner to achieve a high success rate and efficiency while demonstrating strong generalization across tasks. Additionally, we create MAT-THOR, a comprehensive benchmark that features household tasks with two different levels of complexity based on the AI2-THOR environment. The experimental results demonstrate that LaMMA-P achieves a 105% higher success rate and 36% higher efficiency than existing LM-based multiagent planners. The experimental videos, code, datasets, and detailed prompts used in each module can be found on the project website: https://lamma-p.github.io.
arxiv情報
著者 | Xiaopan Zhang,Hao Qin,Fuquan Wang,Yue Dong,Jiachen Li |
発行日 | 2025-03-13 06:17:58+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google