要約
Web熟成された大規模な言語モデル(LLM)の最近の進歩は、複雑な推論タスクで強力なパフォーマンスを示していますが、これらの機能はほとんどが不透明なアーキテクチャを備えた独自のシステムにロックされています。
この作業では、LLMの深い検索を民主化するために設計された透明でモジュラーのマルチエージェントフレームワークである\ textBf {manusearch}を提案します。
Manusearchは、検索と推論のプロセスを3つの共同エージェントに分解します。(1)サブQueriesを繰り返し策定するソリューション計画エージェント、(2)リアルタイムWeb検索を介して関連するドキュメントを取得するインターネット検索エージェント、および(3)生のWebコンテンツから重要な証拠を抽出する構造化されたWebページ読み取りエージェント。
深い推論能力を厳密に評価するために、英語と中国語の両方をカバーするロングテールエンティティのオープンウェブ推論に焦点を当てた挑戦的なベンチマークである\ textbf {orion}を紹介します。
実験結果は、Manusearchが以前のオープンソースベースラインを大幅に上回り、先頭の閉鎖源システムを上回ることさえあることを示しています。
私たちの仕事は、オープンな深い検索システムで再現可能で拡張可能な研究への道を開きます。
https://github.com/rucaibox/manusearchでデータとコードをリリースします
要約(オリジナル)
Recent advances in web-augmented large language models (LLMs) have exhibited strong performance in complex reasoning tasks, yet these capabilities are mostly locked in proprietary systems with opaque architectures. In this work, we propose \textbf{ManuSearch}, a transparent and modular multi-agent framework designed to democratize deep search for LLMs. ManuSearch decomposes the search and reasoning process into three collaborative agents: (1) a solution planning agent that iteratively formulates sub-queries, (2) an Internet search agent that retrieves relevant documents via real-time web search, and (3) a structured webpage reading agent that extracts key evidence from raw web content. To rigorously evaluate deep reasoning abilities, we introduce \textbf{ORION}, a challenging benchmark focused on open-web reasoning over long-tail entities, covering both English and Chinese. Experimental results show that ManuSearch substantially outperforms prior open-source baselines and even surpasses leading closed-source systems. Our work paves the way for reproducible, extensible research in open deep search systems. We release the data and code in https://github.com/RUCAIBox/ManuSearch
arxiv情報
著者 | Lisheng Huang,Yichen Liu,Jinhao Jiang,Rongxiang Zhang,Jiahao Yan,Junyi Li,Wayne Xin Zhao |
発行日 | 2025-05-23 17:02:02+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google