LiteWebAgent: The Open-Source Suite for VLM-Based Web-Agent Applications

要約

VLMベースのWebエージェントアプリケーション用のオープンソーススイートであるLiteWebagentを紹介します。
当社のフレームワークは、最小限のサーバーレスバックエンド構成、直感的なユーザーおよびブラウザインターフェイス、およびエージェントの計画、メモリ、ツリー検索における拡張可能な研究機能を組み合わせた制作対応ソリューションを使用して、Webエージェントエコシステムの重要なギャップに対処します。
コアLiteWebagentエージェントフレームワークについては、再帰関数呼び出しを使用してシンプルでありながら効果的なベースラインを実装し、分離したアクションの生成とアクションの接地を提供しました。
さらに、エージェント計画、エージェントワークフローメモリ、ツリー検索などの高度な研究コンポーネントをモジュール式で拡張可能な方法で統合します。
次に、LiteWebagentエージェントフレームワークをFrontEndとBackEndと展開したシステムとして2つの形式で展開します。(1)プロダクションVercelベースのWebアプリケーションを統合します。これは、エージェント制御されたリモートブラウザーをユーザーに提供します。
LiteWebagentフレームワークはhttps://github.com/pathonai/litewebagentで入手でき、https://lite-web-agent.vercel.app/にフロントエンドが展開されています。

要約(オリジナル)

We introduce LiteWebAgent, an open-source suite for VLM-based web agent applications. Our framework addresses a critical gap in the web agent ecosystem with a production-ready solution that combines minimal serverless backend configuration, intuitive user and browser interfaces, and extensible research capabilities in agent planning, memory, and tree search. For the core LiteWebAgent agent framework, we implemented a simple yet effective baseline using recursive function calling, providing with decoupled action generation and action grounding. In addition, we integrate advanced research components such as agent planning, agent workflow memory, and tree search in a modular and extensible manner. We then integrate the LiteWebAgent agent framework with frontend and backend as deployed systems in two formats: (1) a production Vercel-based web application, which provides users with an agent-controlled remote browser, (2) a Chrome extension leveraging LiteWebAgent’s API to control an existing Chrome browser via CDP (Chrome DevTools Protocol). The LiteWebAgent framework is available at https://github.com/PathOnAI/LiteWebAgent, with deployed frontend at https://lite-web-agent.vercel.app/.

arxiv情報

著者 Danqing Zhang,Balaji Rama,Jingyi Ni,Shiying He,Fu Zhao,Kunyu Chen,Arnold Chen,Junyu Cao
発行日 2025-05-06 06:42:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.MA パーマリンク