TaskGen: A Task-Based, Memory-Infused Agentic Framework using StrictJSON

要約

TaskGen は、エージェントを使用して任意のタスクをサブタスクに分割することで解決する、オープンソースのエージェント フレームワークです。
各サブタスクは、実行する装備された機能または別のエージェントにマップされます。
冗長性 (したがってトークンの使用量) を削減するために、TaskGen は、型チェックや反復エラー修正などの追加機能とともに、大規模言語モデル (LLM) からの JSON 出力を保証する StrictJSON を使用します。
TaskGen の哲学の鍵となるのは、必要な情報に基づいて情報/メモリを管理することです。
障害物の位置が変化する 40×40 の動的な迷路ナビゲーション (解決率 100%)、濃厚な報酬と詳細な目標を備えた TextWorld エスケープ ルーム解決 (解決率 96%)、Web ブラウジング (アクションの 69% が成功) など、さまざまな環境で TaskGen を経験的に評価します。
、MATH データセットの解決 (100 個のレベル 5 問題に対する解決率 71%)、NaturalQuestions データセットの検索拡張生成 (F1 スコア 47.03%)

要約(オリジナル)

TaskGen is an open-sourced agentic framework which uses an Agent to solve an arbitrary task by breaking them down into subtasks. Each subtask is mapped to an Equipped Function or another Agent to execute. In order to reduce verbosity (and hence token usage), TaskGen uses StrictJSON that ensures JSON output from the Large Language Model (LLM), along with additional features such as type checking and iterative error correction. Key to the philosophy of TaskGen is the management of information/memory on a need-to-know basis. We empirically evaluate TaskGen on various environments such as 40×40 dynamic maze navigation with changing obstacle locations (100% solve rate), TextWorld escape room solving with dense rewards and detailed goals (96% solve rate), web browsing (69% of actions successful), solving the MATH dataset (71% solve rate over 100 Level-5 problems), Retrieval Augmented Generation on NaturalQuestions dataset (F1 score of 47.03%)

arxiv情報

著者 John Chong Min Tan,Prince Saroj,Bharat Runwal,Hardik Maheshwari,Brian Lim Yi Sheng,Richard Cottrill,Alankrit Chona,Ambuj Kumar,Mehul Motani
発行日 2024-07-22 15:37:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.MA パーマリンク