EICopilot: Search and Explore Enterprise Information over Large-scale Knowledge Graphs with LLM-driven Agents

要約

このペーパーでは、法人、登録資本、主要株主の詳細などの広範なオンライン知識グラフ内で、エンタープライズ登録データの検索と調査を強化する新しいエージェントベースのソリューションであるEicopilotを紹介します。
従来の方法では、テキストベースのクエリと手動サブグラフの探索が必要であり、多くの場合、時間のかかるプロセスをもたらします。
Baidu Enterprise Searchを介してチャットボットとして展開されたEicopilotは、大規模な言語モデル(LLM)を利用して自然言語の質問を解釈することにより、このランドスケープを改善します。
このソリューションは、Gremlinスクリプトを自動的に生成および実行し、複雑な企業関係の効率的な要約を提供します。
明確な機能代表的なクエリをコンパイルして注釈を組み合わせたデータの前処理パイプライン(コンテキスト学習(ICL)の例のベクトルデータベース)、包括的な推論パイプラインと想定チェーンとICLを組み合わせて、知識グラフ検索のグレムリンスクリプト生成を強化する包括的な推論パイプライン
そして、探索、およびスクリプトの精度を高めるための意図認識を向上させる新しいクエリマスキング戦略。
経験的評価は、速度と精度を含むエイコピロットの優れたパフォーマンスをベースラインメソッドよりも、\ emph {full mask}バリアントを10.00%の低いものに達成し、最大82.14%の実行正しさを実現します。
これらのコンポーネントは、優れたクエリ機能と複雑なデータセットの要約に集合的に貢献し、エイコピロットをエンタープライズ情報検索のための大規模な知識グラフの探索と搾取の画期的なツールとして配置します。

要約(オリジナル)

The paper introduces EICopilot, an novel agent-based solution enhancing search and exploration of enterprise registration data within extensive online knowledge graphs like those detailing legal entities, registered capital, and major shareholders. Traditional methods necessitate text-based queries and manual subgraph explorations, often resulting in time-consuming processes. EICopilot, deployed as a chatbot via Baidu Enterprise Search, improves this landscape by utilizing Large Language Models (LLMs) to interpret natural language queries. This solution automatically generates and executes Gremlin scripts, providing efficient summaries of complex enterprise relationships. Distinct feature a data pre-processing pipeline that compiles and annotates representative queries into a vector database of examples for In-context learning (ICL), a comprehensive reasoning pipeline combining Chain-of-Thought with ICL to enhance Gremlin script generation for knowledge graph search and exploration, and a novel query masking strategy that improves intent recognition for heightened script accuracy. Empirical evaluations demonstrate the superior performance of EICopilot, including speed and accuracy, over baseline methods, with the \emph{Full Mask} variant achieving a syntax error rate reduction to as low as 10.00% and an execution correctness of up to 82.14%. These components collectively contribute to superior querying capabilities and summarization of intricate datasets, positioning EICopilot as a groundbreaking tool in the exploration and exploitation of large-scale knowledge graphs for enterprise information search.

arxiv情報

著者 Yuhui Yun,Huilong Ye,Xinru Li,Ruojia Li,Jingfeng Deng,Li Li,Haoyi Xiong
発行日 2025-01-23 15:22:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.IR パーマリンク