要約
現在、ツールの使用、計画、フィードバック学習は、さまざまなタスクにわたって大規模言語モデル (LLM) ベースのエージェントを開発するための 3 つの主要なパラダイムです。
各パラダイムに対して多数のフレームワークが考案されていますが、その複雑なワークフローと一貫性のない分類法により、さまざまなパラダイムにわたるフレームワークを理解し、レビューする際に課題が生じています。
この調査では、これらのフレームワークを体系的にレビューおよび議論するために、統一された分類法が導入されています。
具体的には、1) この分類法は、環境/タスク、一般的な LLM プロファイルの役割 (ポリシー モデル、評価者、および動的モデル)、および以前の研究で見つかった普遍的に適用可能なワークフローを定義し、2) LMPR の実装に関する主要な観点の比較を可能にし、
さまざまなエージェント パラダイムにわたるワークフローの使用。
要約(オリジナル)
Tool use, planning, and feedback learning are currently three prominent paradigms for developing Large Language Model (LLM)-based agents across various tasks. Although numerous frameworks have been devised for each paradigm, their intricate workflows and inconsistent taxonomy create challenges in understanding and reviewing the frameworks across different paradigms. This survey introduces a unified taxonomy to systematically review and discuss these frameworks. Specifically, 1) the taxonomy defines environments/tasks, common LLM-profiled roles (policy models, evaluators, and dynamic models), and universally applicable workflows found in prior work, and 2) it enables a comparison of key perspectives on LMPR implementations and workflow usage across different agent paradigms.
arxiv情報
著者 | Xinzhe Li |
発行日 | 2024-09-17 14:02:29+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google