Meta-Task Planning for Language Agents

要約

神経言語モデルの急速な進歩は、インテリジェント エージェント研究の新たな急増を引き起こしました。
従来のエージェントとは異なり、大規模言語モデルベースのエージェント (LLM エージェント) は、その優れた推論能力と汎化能力により、汎用人工知能 (AGI) を実現するための有望なパラダイムとして浮上しています。
現実世界のタスクで LLM エージェントが成功するには、効果的な計画が不可欠であり、コミュニティで非常に追求されているトピックとなっています。
現在の計画方法は通常、タスクを実行可能なアクション シーケンスに変換します。
ただし、複雑なタスクの実行可能または最適なシーケンスを細かい粒度で決定することは、多くの場合、異種アクションの長いチェーンを合成する必要があるため、依然として困難です。
この文書では、メタタスク プランニング (MTP) を紹介します。これは、協調的な LLM ベースのマルチエージェント システムのゼロショット手法であり、複雑なタスク プランニングを下位タスクの階層 (メタタスク) に分解することで簡素化します。
各メタタスクは実行可能なアクションにマッピングされます。
MTP は、TravelPlanner と API-Bank という 2 つの厳密なベンチマークで評価されました。
特に、MTP は、TravelPlanner で $\sim40\%$ の平均成功率を達成しました。これは、最先端 (SOTA) のベースライン ($2.92\%$) を大幅に上回っており、$LLM_{api}$-4 を上回っています。
$\sim14\%$ による ReAct on API-Bank は、LLM とマルチエージェント システムの統合の計り知れない可能性を示しています。

要約(オリジナル)

The rapid advancement of neural language models has sparked a new surge of intelligent agent research. Unlike traditional agents, large language model-based agents (LLM agents) have emerged as a promising paradigm for achieving artificial general intelligence (AGI) due to their superior reasoning and generalization capabilities. Effective planning is crucial for the success of LLM agents in real-world tasks, making it a highly pursued topic in the community. Current planning methods typically translate tasks into executable action sequences. However, determining a feasible or optimal sequence for complex tasks at fine granularity, which often requires compositing long chains of heterogeneous actions, remains challenging. This paper introduces Meta-Task Planning (MTP), a zero-shot methodology for collaborative LLM-based multi-agent systems that simplifies complex task planning by decomposing it into a hierarchy of subordinate tasks, or meta-tasks. Each meta-task is then mapped into executable actions. MTP was assessed on two rigorous benchmarks, TravelPlanner and API-Bank. Notably, MTP achieved an average $\sim40\%$ success rate on TravelPlanner, significantly higher than the state-of-the-art (SOTA) baseline ($2.92\%$), and outperforming $LLM_{api}$-4 with ReAct on API-Bank by $\sim14\%$, showing the immense potential of integrating LLM with multi-agent systems.

arxiv情報

著者 Cong Zhang,Derrick Goh Xin Deik,Dexun Li,Hao Zhang,Yong Liu
発行日 2024-05-28 13:56:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.LG パーマリンク