要約
LLM ベースのエージェントにツールを統合することで、スタンドアロン LLM と従来のエージェントの制限された機能の問題が克服されました。
しかし、これらのテクノロジーの組み合わせと、いくつかの最先端の作品で提案されている機能強化は、非統合のソフトウェア アーキテクチャに従っており、その結果、モジュール性が欠如していました。
実際、彼らは主に機能に焦点を当てており、エージェント内のコンポーネントの境界の定義を見落としていました。
これにより、研究者間で用語とアーキテクチャのあいまいさが生じましたが、この論文では、機能とソフトウェア アーキテクチャの両方の観点から LLM ベースのエージェント開発の明確な基盤を確立する統一フレームワークを提案することで、この問題に対処しました。
私たちのフレームワークである LLM-Agent-UMF (LLM ベースのエージェント統合モデリング フレームワーク) は、エージェントのさまざまなコンポーネントを明確に区別し、LLM を設定し、新たに導入された要素であるツールとは別に、コア エージェントの役割を果たします。
エージェントの中央コーディネーター。計画、記憶、プロファイル、アクション、セキュリティの 5 つのモジュールで構成されます。後者は以前の作品では無視されがちでした。
コアエージェントの内部構造の違いにより、コアエージェントをパッシブタイプとアクティブタイプの分類に分類することができました。
これに基づいて、さまざまな個々のエージェントの固有の特性を組み合わせたさまざまなマルチコア エージェント アーキテクチャを提案しました。
評価の目的で、このフレームワークを最先端のエージェントの選択に適用し、その機能との整合性を実証し、見落とされているアーキテクチャの側面を明確にしました。
さらに、特徴的なエージェントをハイブリッド アクティブ/パッシブ コア エージェント システムに統合することで、提案した 4 つのアーキテクチャを徹底的に評価しました。
この分析により、改善の可能性について明確な洞察が得られ、特定の薬剤の組み合わせに伴う課題が浮き彫りになりました。
要約(オリジナル)
The integration of tools in LLM-based agents overcame the difficulties of standalone LLMs and traditional agents’ limited capabilities. However, the conjunction of these technologies and the proposed enhancements in several state-of-the-art works followed a non-unified software architecture resulting in a lack of modularity. Indeed, they focused mainly on functionalities and overlooked the definition of the component’s boundaries within the agent. This caused terminological and architectural ambiguities between researchers which we addressed in this paper by proposing a unified framework that establishes a clear foundation for LLM-based agents’ development from both functional and software architectural perspectives. Our framework, LLM-Agent-UMF (LLM-based Agent Unified Modeling Framework), clearly distinguishes between the different components of an agent, setting LLMs, and tools apart from a newly introduced element: the core-agent, playing the role of the central coordinator of the agent which comprises five modules: planning, memory, profile, action, and security, the latter often neglected in previous works. Differences in the internal structure of core-agents led us to classify them into a taxonomy of passive and active types. Based on this, we proposed different multi-core agent architectures combining unique characteristics of various individual agents. For evaluation purposes, we applied this framework to a selection of state-of-the-art agents, thereby demonstrating its alignment with their functionalities and clarifying the overlooked architectural aspects. Moreover, we thoroughly assessed four of our proposed architectures by integrating distinctive agents into hybrid active/passive core-agents’ systems. This analysis provided clear insights into potential improvements and highlighted the challenges involved in the combination of specific agents.
arxiv情報
著者 | Amine B. Hassouna,Hana Chaari,Ines Belhaj |
発行日 | 2024-09-17 17:54:17+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google