AgentKit: Flow Engineering with Graphs, not Coding

要約

多機能エージェント向けの直感的な LLM プロンプト フレームワーク (AgentKit) を提案します。
AgentKit は、単純な自然言語プロンプトから複雑な「思考プロセス」を明示的に構築するための統合フレームワークを提供します。
AgentKit の基本的な構成要素は、特定のサブタスクに対する自然言語プロンプトを含むノードです。
次にユーザーは、レゴのピースを積み重ねるかのように、ノードのチェーンをまとめます。
ノードのチェーンは、自然に構造化された「思考プロセス」を明示的に強制するように設計できます。
たとえば、論文を書くタスクの場合、1) 核となるメッセージを特定する、2) 以前の研究のギャップを特定するなどの思考プロセスから始めることができます。AgentKit のノードは、さまざまな方法で設計および組み合わせて、複数の実装を行うことができます。
オンザフライの階層計画、リフレクション、対話からの学習などの高度な機能。
さらに、モジュール式の性質と人間の明示的な思考プロセスをシミュレートする直感的な設計により、基本的なエージェントはサブタスクのプロンプトのリストと同じくらい単純に実装できるため、プログラミングの経験がなくても設計および調整できます。
AgentKit を通じて設計されたエージェントが WebShop と Crafter で SOTA パフォーマンスを達成することを定量的に示します。
これらの進歩は、LLM エージェントを効果的にし、より広範囲のアプリケーションにアクセスできるようにする AgentKit の可能性を強調しています。
https://github.com/holmeswww/AgentKit

要約(オリジナル)

We propose an intuitive LLM prompting framework (AgentKit) for multifunctional agents. AgentKit offers a unified framework for explicitly constructing a complex ‘thought process’ from simple natural language prompts. The basic building block in AgentKit is a node, containing a natural language prompt for a specific subtask. The user then puts together chains of nodes, like stacking LEGO pieces. The chains of nodes can be designed to explicitly enforce a naturally structured ‘thought process’. For example, for the task of writing a paper, one may start with the thought process of 1) identify a core message, 2) identify prior research gaps, etc. The nodes in AgentKit can be designed and combined in different ways to implement multiple advanced capabilities including on-the-fly hierarchical planning, reflection, and learning from interactions. In addition, due to the modular nature and the intuitive design to simulate explicit human thought process, a basic agent could be implemented as simple as a list of prompts for the subtasks and therefore could be designed and tuned by someone without any programming experience. Quantitatively, we show that agents designed through AgentKit achieve SOTA performance on WebShop and Crafter. These advances underscore AgentKit’s potential in making LLM agents effective and accessible for a wider range of applications. https://github.com/holmeswww/AgentKit

arxiv情報

著者 Yue Wu,Yewen Fan,So Yeon Min,Shrimai Prabhumoye,Stephen McAleer,Yonatan Bisk,Ruslan Salakhutdinov,Yuanzhi Li,Tom Mitchell
発行日 2024-04-17 15:40:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク