Tulip Agent — Enabling LLM-Based Agents to Solve Tasks Using Large Tool Libraries

要約

チューリップ エージェントは、潜在的に多数のツールを含むツール ライブラリへの作成、読み取り、更新、および削除のアクセス権を備えた自律的な LLM ベースのエージェントのアーキテクチャです。
最先端の実装とは対照的に、tulip エージェントは、モデルのコンテキスト ウィンドウにカウントされるシステム プロンプト内のすべての使用可能なツールの説明をエンコードしたり、適切なツールを取得するためのプロンプト全体を埋め込んだりしません。
代わりに、チューリップ エージェントは、ベクター ストアとして例示的に実装される拡張可能なツール ライブラリ内の適切なツールを再帰的に検索できます。
チューリップ エージェント アーキテクチャにより、推論コストが大幅に削減され、大規模なツール ライブラリの使用も可能になり、エージェントがツール セットを適応および拡張できるようになります。
私たちは数学の文脈でいくつかのアブレーション研究を使用してアーキテクチャを評価し、ロボット工学への応用でその一般化可能性を実証します。
リファレンス実装とベンチマークは、github.com/HRI-EU/tulip_agent で入手できます。

要約(オリジナル)

We introduce tulip agent, an architecture for autonomous LLM-based agents with Create, Read, Update, and Delete access to a tool library containing a potentially large number of tools. In contrast to state-of-the-art implementations, tulip agent does not encode the descriptions of all available tools in the system prompt, which counts against the model’s context window, or embed the entire prompt for retrieving suitable tools. Instead, the tulip agent can recursively search for suitable tools in its extensible tool library, implemented exemplarily as a vector store. The tulip agent architecture significantly reduces inference costs, allows using even large tool libraries, and enables the agent to adapt and extend its set of tools. We evaluate the architecture with several ablation studies in a mathematics context and demonstrate its generalizability with an application to robotics. A reference implementation and the benchmark are available at github.com/HRI-EU/tulip_agent.

arxiv情報

著者 Felix Ocker,Daniel Tanneberg,Julian Eggert,Michael Gienger
発行日 2024-07-31 17:50:54+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO, H.3.3 パーマリンク