SkillWeaver: Web Agents can Self-Improve by Discovering and Honing Skills

要約

複雑な環境で生き残り、繁栄するために、人間は環境探査、経験の階層的な抽象化、再利用可能なスキルへの階層的な抽象化、および増え続けるスキルレパートリーの共同構築を通じて、洗練された自己改善メカニズムを進化させました。
最近の進歩にもかかわらず、自律的なWebエージェントは依然として重要な自己改善能力を欠いており、手続き上の知識の抽象化、精製スキル、スキル構成に苦しんでいます。
この作業では、APIとして再利用可能なスキルを自律的に合成することによりエージェントが自己改善できるようにするスキル中心のフレームワークであるSkillWeaverを紹介します。
新しいウェブサイトを考慮して、エージェントはスキルを自律的に発見し、練習のためにそれらを実行し、練習体験を堅牢なAPIに蒸留します。
反復探査により、軽量のプラグアンドプレイAPIのライブラリが継続的に拡張され、エージェントの機能が大幅に向上します。
WebArenaおよび実際のWebサイトでの実験は、SkillWeaverの有効性を示しており、それぞれ31.8%と39.8%の相対的な成功率の改善を達成しています。
さらに、強力なエージェントによって合成されたAPIは、転送可能なスキルを通じてより弱いエージェントを大幅に強化し、WebArenaで最大54.3%の改善をもたらします。
これらの結果は、さまざまなウェブエージェント間でシームレスに共有できるAPIへの多様なWebサイトの相互作用を磨くことの有効性を示しています。

要約(オリジナル)

To survive and thrive in complex environments, humans have evolved sophisticated self-improvement mechanisms through environment exploration, hierarchical abstraction of experiences into reuseable skills, and collaborative construction of an ever-growing skill repertoire. Despite recent advancements, autonomous web agents still lack crucial self-improvement capabilities, struggling with procedural knowledge abstraction, refining skills, and skill composition. In this work, we introduce SkillWeaver, a skill-centric framework enabling agents to self-improve by autonomously synthesizing reusable skills as APIs. Given a new website, the agent autonomously discovers skills, executes them for practice, and distills practice experiences into robust APIs. Iterative exploration continually expands a library of lightweight, plug-and-play APIs, significantly enhancing the agent’s capabilities. Experiments on WebArena and real-world websites demonstrate the efficacy of SkillWeaver, achieving relative success rate improvements of 31.8% and 39.8%, respectively. Additionally, APIs synthesized by strong agents substantially enhance weaker agents through transferable skills, yielding improvements of up to 54.3% on WebArena. These results demonstrate the effectiveness of honing diverse website interactions into APIs, which can be seamlessly shared among various web agents.

arxiv情報

著者 Boyuan Zheng,Michael Y. Fatemi,Xiaolong Jin,Zora Zhiruo Wang,Apurva Gandhi,Yueqi Song,Yu Gu,Jayanth Srinivasa,Gaowen Liu,Graham Neubig,Yu Su
発行日 2025-04-09 17:51:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.CV パーマリンク