KnowAgent: Knowledge-Augmented Planning for LLM-Based Agents

要約

大規模言語モデル (LLM) は、複雑な推論タスクでは大きな可能性を示していますが、より複雑な課題に取り組む場合、特に実行可能なアクションの生成を通じて環境と対話する場合には不十分です。
この不十分さは主に、言語エージェントに組み込まれたアクション知識の欠如に起因しており、タスク解決中に計画の軌道を効果的に導くことができず、計画の幻覚を引き起こします。
この問題に対処するために、明示的なアクション知識を組み込むことで LLM の計画能力を強化するように設計された新しいアプローチである KnowAgent を紹介します。
具体的には、KnowAgent はアクション知識ベースと知識豊富な自己学習戦略を採用して、計画中にアクション パスを制約し、より合理的な軌道合成を可能にし、それによって言語エージェントの計画パフォーマンスを向上させます。
さまざまなバックボーン モデルに基づく HotpotQA と ALFWorld の実験結果は、KnowAgent が既存のベースラインと同等またはそれ以上のパフォーマンスを達成できることを示しています。
さらなる分析により、幻覚軽減計画の観点から KnowAgent の有効性が示されました。
コードは https://github.com/zjunlp/KnowAgent で入手できます。

要約(オリジナル)

Large Language Models (LLMs) have demonstrated great potential in complex reasoning tasks, yet they fall short when tackling more sophisticated challenges, especially when interacting with environments through generating executable actions. This inadequacy primarily stems from the lack of built-in action knowledge in language agents, which fails to effectively guide the planning trajectories during task solving and results in planning hallucination. To address this issue, we introduce KnowAgent, a novel approach designed to enhance the planning capabilities of LLMs by incorporating explicit action knowledge. Specifically, KnowAgent employs an action knowledge base and a knowledgeable self-learning strategy to constrain the action path during planning, enabling more reasonable trajectory synthesis, and thereby enhancing the planning performance of language agents. Experimental results on HotpotQA and ALFWorld based on various backbone models demonstrate that KnowAgent can achieve comparable or superior performance to existing baselines. Further analysis indicates the effectiveness of KnowAgent in terms of planning hallucinations mitigation. Code is available in https://github.com/zjunlp/KnowAgent.

arxiv情報

著者 Yuqi Zhu,Shuofei Qiao,Yixin Ou,Shumin Deng,Ningyu Zhang,Shiwei Lyu,Yue Shen,Lei Liang,Jinjie Gu,Huajun Chen
発行日 2024-03-05 16:39:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.HC, cs.LG, cs.MA パーマリンク