要約
検索された生成(RAG)は、LLM検索機能を強化するための主要で最も広く使用されている技術の1つですが、商業用ユースケースでは依然として大きな制限に直面しています。
RAGは主に、検索のための埋め込みスペースにおけるクエリチャンクテキストとテキストへの類似性に依存しており、チャンク全体のより深いセマンティックな関係を捉えることができず、チャンク戦略に非常に敏感であり、幻覚を起こしやすくなります。
これらの課題に対処するために、最初に非構造化データから動的かつ自動的に知識グラフを構築するグラフベースの検索フレームワークであるTobugraphを提案します。
LLMSを使用して、トブグラフは構造化された知識とデータ間の多様な関係を抽出し、Ragのテキストとテキストの類似性を超えて進みます。
検索は、グラフトラバーサルを通じて達成され、抽出された関係と構造を活用して検索の精度を高め、幻覚を減らしながらチャンキング構成の必要性を排除します。
Toburaphの有効性は、個人の記憶組織と検索のための生産における現実世界のアプリケーションであるTobuでの有効性を示しています。
実際のユーザーデータを使用した評価は、トブグラフが精度とリコールの両方で複数のRAG実装を上回ることを示しており、検索の精度を改善することでユーザーエクスペリエンスを大幅に改善します。
要約(オリジナル)
Retrieval-Augmented Generation (RAG) is one of the leading and most widely used techniques for enhancing LLM retrieval capabilities, but it still faces significant limitations in commercial use cases. RAG primarily relies on the query-chunk text-to-text similarity in the embedding space for retrieval and can fail to capture deeper semantic relationships across chunks, is highly sensitive to chunking strategies, and is prone to hallucinations. To address these challenges, we propose TOBUGraph, a graph-based retrieval framework that first constructs the knowledge graph from unstructured data dynamically and automatically. Using LLMs, TOBUGraph extracts structured knowledge and diverse relationships among data, going beyond RAG’s text-to-text similarity. Retrieval is achieved through graph traversal, leveraging the extracted relationships and structures to enhance retrieval accuracy, eliminating the need for chunking configurations while reducing hallucination. We demonstrate TOBUGraph’s effectiveness in TOBU, a real-world application in production for personal memory organization and retrieval. Our evaluation using real user data demonstrates that TOBUGraph outperforms multiple RAG implementations in both precision and recall, significantly improving user experience through improved retrieval accuracy.
arxiv情報
著者 | Savini Kashmira,Jayanaka L. Dantanarayana,Joshua Brodsky,Ashish Mahendra,Yiping Kang,Krisztian Flautner,Lingjia Tang,Jason Mars |
発行日 | 2025-04-01 14:03:15+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google