要約
複雑な環境で生き残り、繁栄するために、人間は環境探査、経験の階層的な抽象化、再利用可能なスキルへの階層的な抽象化、および増え続けるスキルレパートリーの共同構築を通じて、洗練された自己改善メカニズムを進化させました。
最近の進歩にもかかわらず、自律的なWebエージェントは依然として重要な自己改善能力を欠いており、手続き上の知識の抽象化、精製スキル、スキル構成に苦しんでいます。
この作業では、APIとして再利用可能なスキルを自律的に合成することによりエージェントが自己改善できるようにするスキル中心のフレームワークであるSkillWeaverを紹介します。
新しいウェブサイトを考慮して、エージェントはスキルを自律的に発見し、練習のためにそれらを実行し、練習体験を堅牢なAPIに蒸留します。
反復探査により、軽量のプラグアンドプレイAPIのライブラリが継続的に拡張され、エージェントの機能が大幅に向上します。
WebArenaおよび実際のWebサイトでの実験は、SkillWeaverの有効性を示しており、それぞれ31.8%と39.8%の相対的な成功率の改善を達成しています。
さらに、強力なエージェントによって合成されたAPIは、転送可能なスキルを通じてより弱いエージェントを大幅に強化し、WebArenaで最大54.3%の改善をもたらします。
これらの結果は、さまざまなウェブエージェント間でシームレスに共有できるAPIへの多様なWebサイトの相互作用を磨くことの有効性を示しています。
要約(オリジナル)
To survive and thrive in complex environments, humans have evolved sophisticated self-improvement mechanisms through environment exploration, hierarchical abstraction of experiences into reuseable skills, and collaborative construction of an ever-growing skill repertoire. Despite recent advancements, autonomous web agents still lack crucial self-improvement capabilities, struggling with procedural knowledge abstraction, refining skills, and skill composition. In this work, we introduce SkillWeaver, a skill-centric framework enabling agents to self-improve by autonomously synthesizing reusable skills as APIs. Given a new website, the agent autonomously discovers skills, executes them for practice, and distills practice experiences into robust APIs. Iterative exploration continually expands a library of lightweight, plug-and-play APIs, significantly enhancing the agent’s capabilities. Experiments on WebArena and real-world websites demonstrate the efficacy of SkillWeaver, achieving relative success rate improvements of 31.8% and 39.8%, respectively. Additionally, APIs synthesized by strong agents substantially enhance weaker agents through transferable skills, yielding improvements of up to 54.3% on WebArena. These results demonstrate the effectiveness of honing diverse website interactions into APIs, which can be seamlessly shared among various web agents.
arxiv情報
著者 | Boyuan Zheng,Michael Y. Fatemi,Xiaolong Jin,Zora Zhiruo Wang,Apurva Gandhi,Yueqi Song,Yu Gu,Jayanth Srinivasa,Gaowen Liu,Graham Neubig,Yu Su |
発行日 | 2025-04-09 17:51:50+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google