要約
複雑なコンピュータタスクを自動化できるデジタルエージェントは、人間とコンピュータの相互作用を強化する計り知れない可能性があるため、大きな注目を集めています。
しかし、既存のエージェント手法は、特に実世界の環境でオープンエンドのコンピュータタスクを処理する場合に、一般化および特殊化の機能に欠陥があります。
App Store の豊富な機能にインスピレーションを得て、コンピューター タスクを自動化するために異種エージェントを動的に統合するように設計されたスケーラブルなプラットフォームである AgentStore を紹介します。
AgentStore により、ユーザーはサードパーティ エージェントを統合できるようになり、システムの機能が継続的に強化され、急速に進化するオペレーティング システムに適応できるようになります。
さらに、\textbf{AgentToken} 戦略を備えた新しいコア \textbf{MetaAgent} を提案し、多様なエージェントを効率的に管理し、ドメイン固有のタスクとシステム全体のタスクの両方に専門的かつ汎用的な能力を活用します。
3 つの困難なベンチマークに関する広範な実験により、AgentStore が狭い機能を備えた以前のシステムの制限を超えていることが実証され、特に OSWorld ベンチマークで 11.21\% から 23.85\% への大幅な改善を達成し、以前の結果の 2 倍以上を達成しました。
包括的な定量的および定性的結果は、汎用化と専門化の両方でエージェント システムを強化する AgentStore の能力をさらに実証し、特化したジェネラリスト コンピュータ アシスタントを開発する可能性を強調しています。
すべてのコードは https://chengyou-jia.github.io/AgentStore-Home で公開されます。
要約(オリジナル)
Digital agents capable of automating complex computer tasks have attracted considerable attention due to their immense potential to enhance human-computer interaction. However, existing agent methods exhibit deficiencies in their generalization and specialization capabilities, especially in handling open-ended computer tasks in real-world environments. Inspired by the rich functionality of the App store, we present AgentStore, a scalable platform designed to dynamically integrate heterogeneous agents for automating computer tasks. AgentStore empowers users to integrate third-party agents, allowing the system to continuously enrich its capabilities and adapt to rapidly evolving operating systems. Additionally, we propose a novel core \textbf{MetaAgent} with the \textbf{AgentToken} strategy to efficiently manage diverse agents and utilize their specialized and generalist abilities for both domain-specific and system-wide tasks. Extensive experiments on three challenging benchmarks demonstrate that AgentStore surpasses the limitations of previous systems with narrow capabilities, particularly achieving a significant improvement from 11.21\% to 23.85\% on the OSWorld benchmark, more than doubling the previous results. Comprehensive quantitative and qualitative results further demonstrate AgentStore’s ability to enhance agent systems in both generalization and specialization, underscoring its potential for developing the specialized generalist computer assistant. All our codes will be made publicly available in https://chengyou-jia.github.io/AgentStore-Home.
arxiv情報
著者 | Chengyou Jia,Minnan Luo,Zhuohang Dang,Qiushi Sun,Fangzhi Xu,Junlin Hu,Tianbao Xie,Zhiyong Wu |
発行日 | 2024-10-24 09:58:40+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google