要約
言語モデル (LM) は自然言語を理解できるため、人間の指示を解析して自律ロボットのタスク プランを作成するための強力なツールになります。
ドメイン固有の知識と手作りのルールに依存する従来の計画方法とは異なり、LM は多様なデータから一般化し、最小限の調整でさまざまなタスクに適応し、圧縮された知識ベースとして機能します。
ただし、標準的な形式の LM は、長期的なタスク、特に部分的に監視可能なマルチエージェント設定での課題に直面します。
我々は、部分的に観測可能な環境内で長期的なタスクにおいて最先端の結果を達成する計画用の認知アーキテクチャである、LM ベースのマルチエージェント ロボティクスのための Long-Horizon Planner (LLaMAR) を提案します。
LLaMAR は、計画、実行、修正、検証のフレームワークを採用しており、オラクルやシミュレータに依存せずにアクション実行のフィードバックから自己修正することができます。
さらに、AI2-THOR 環境内でさまざまな複雑さの家事を網羅する包括的なテスト スイートである MAP-THOR も紹介します。
実験によると、LLaMAR は、MAP-THOR および検索/救助タスクにおいて、他の最先端の LM ベースのマルチエージェント プランナーよりも 30% 高い成功率を達成します。
コードは https://github.com/nsidn98/LLaMAR にあります。
要約(オリジナル)
The ability of Language Models (LMs) to understand natural language makes them a powerful tool for parsing human instructions into task plans for autonomous robots. Unlike traditional planning methods that rely on domain-specific knowledge and handcrafted rules, LMs generalize from diverse data and adapt to various tasks with minimal tuning, acting as a compressed knowledge base. However, LMs in their standard form face challenges with long-horizon tasks, particularly in partially observable multi-agent settings. We propose an LM-based Long-Horizon Planner for Multi-Agent Robotics (LLaMAR), a cognitive architecture for planning that achieves state-of-the-art results in long-horizon tasks within partially observable environments. LLaMAR employs a plan-act-correct-verify framework, allowing self-correction from action execution feedback without relying on oracles or simulators. Additionally, we present MAP-THOR, a comprehensive test suite encompassing household tasks of varying complexity within the AI2-THOR environment. Experiments show that LLaMAR achieves a 30% higher success rate than other state-of-the-art LM-based multi-agent planners in MAP-THOR and Search \& Rescue tasks. Code can be found at https://github.com/nsidn98/LLaMAR
arxiv情報
著者 | Siddharth Nayak,Adelmo Morrison Orozco,Marina Ten Have,Vittal Thirumalai,Jackson Zhang,Darren Chen,Aditya Kapoor,Eric Robinson,Karthik Gopalakrishnan,James Harrison,Brian Ichter,Anuj Mahajan,Hamsa Balakrishnan |
発行日 | 2025-01-13 06:03:14+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google