要約
現在、ツールの使用、計画、フィードバック学習は、さまざまなタスクにわたって大規模言語モデル (LLM) ベースのエージェントを開発するための 3 つの主要なパラダイムです。
各パラダイムに対して多数のフレームワークが考案されていますが、その複雑なワークフローと一貫性のない分類法により、さまざまなパラダイムにわたるフレームワークを理解し、レビューする際に課題が生じています。
この調査では、これらのフレームワークを体系的にレビューおよび議論するために、統一された分類法が導入されています。
具体的には、1) この分類法は、環境/タスク、一般的な LLM プロファイルの役割または LMPR (ポリシー モデル、評価者、および動的モデル)、および以前の研究で見つかった普遍的に適用可能なワークフローを定義し、2) 分類法により、
LMPR の実装と、さまざまなエージェント パラダイムとフレームワークにわたるワークフロー設計。
3) 最後に、既存のワークフロー設計における 3 つの制限を特定し、将来の作業について系統的に議論します。
要約(オリジナル)
Tool use, planning, and feedback learning are currently three prominent paradigms for developing Large Language Model (LLM)-based agents across various tasks. Although numerous frameworks have been devised for each paradigm, their intricate workflows and inconsistent taxonomy create challenges in understanding and reviewing the frameworks across different paradigms. This survey introduces a unified taxonomy to systematically review and discuss these frameworks. Specifically, 1) the taxonomy defines environments/tasks, common LLM-profiled roles or LMPRs (policy models, evaluators, and dynamic models), and universally applicable workflows found in prior work, and 2) it enables a comparison of key perspectives on the implementations of LMPRs and workflow designs across different agent paradigms and frameworks. 3) Finally, we identify three limitations in existing workflow designs and systematically discuss the future work.
arxiv情報
著者 | Xinzhe Li |
発行日 | 2024-10-23 11:36:57+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google