要約
TapeAgents は、エージェント セッションの詳細で構造化されたログ テープを中心に構築されたエージェント フレームワークであり、セッションの再開可能な状態の役割も果たします。
TapeAgents では、テープを活用して、LLM エージェント開発ライフサイクルのすべての段階を促進します。
エージェントは、テープと LLM 出力を処理して推論し、新しい思考とアクションのステップを生成し、それらをテープに追加します。
次に、環境は、同様に観察ステップをテープに追加することによって、エージェントのアクションに反応します。
このテープ中心の設計により、TapeAgent は AI 実践者に総合的なエンドツーエンドのサポートを提供できます。
開発段階では、テープによりセッションの永続化、エージェントの監査、段階的なデバッグが容易になります。
導入後は、評価、微調整、即時調整のためにテープを再利用できます。
重要なのは、他のエージェントからのテープを適応させたり、改訂された過去のテープを使用したりできることです。
このレポートでは、TapeAgent の設計について詳しく説明します。
モノリシック エージェントとマルチエージェント チームの構築、エージェント プロンプトの最適化、エージェントの LLM の微調整などの具体的な例をいくつか示して、TapeAgent の可能なアプリケーションを示します。
私たちはツールのプロトタイプを紹介し、TapeAgents を使用して Llama-3.1-8B フォーム入力アシスタントを微調整し、桁違いに安価でありながら GPT-4o と同等のパフォーマンスを実現するケース スタディを報告します。
最後に、比較分析により、以前のフレームワークに対する TapeAgents の利点は、構造化された構成を備えた再開可能なモジュール式ステート マシンとしての LLM エージェントの新しい設計に由来しており、詳細な構造化ログを生成し、これらのログをトレーニング テキストに変換できることがわかります。
以前の作品にはなかった機能のユニークな組み合わせ。
要約(オリジナル)
We present TapeAgents, an agent framework built around a granular, structured log tape of the agent session that also plays the role of the session’s resumable state. In TapeAgents we leverage tapes to facilitate all stages of the LLM Agent development lifecycle. The agent reasons by processing the tape and the LLM output to produce new thought and action steps and append them to the tape. The environment then reacts to the agent’s actions by likewise appending observation steps to the tape. By virtue of this tape-centred design, TapeAgents can provide AI practitioners with holistic end-to-end support. At the development stage, tapes facilitate session persistence, agent auditing, and step-by-step debugging. Post-deployment, one can reuse tapes for evaluation, fine-tuning, and prompt-tuning; crucially, one can adapt tapes from other agents or use revised historical tapes. In this report, we explain the TapeAgents design in detail. We demonstrate possible applications of TapeAgents with several concrete examples of building monolithic agents and multi-agent teams, of optimizing agent prompts and finetuning the agent’s LLM. We present tooling prototypes and report a case study where we use TapeAgents to finetune a Llama-3.1-8B form-filling assistant to perform as well as GPT-4o while being orders of magnitude cheaper. Lastly, our comparative analysis shows that TapeAgents’s advantages over prior frameworks stem from our novel design of the LLM agent as a resumable, modular state machine with a structured configuration, that generates granular, structured logs and that can transform these logs into training text — a unique combination of features absent in previous work.
arxiv情報
| 著者 | Dzmitry Bahdanau,Nicolas Gontier,Gabriel Huang,Ehsan Kamalloo,Rafael Pardinas,Alex Piché,Torsten Scholak,Oleh Shliazhko,Jordan Prince Tremblay,Karam Ghanem,Soham Parikh,Mitul Tiwari,Quaizar Vohra |
| 発行日 | 2024-12-11 15:09:54+00:00 |
| arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google