要約
本論文では、Plan*RAGを紹介する。Plan*RAGは、テスト時間の推論プラン生成を通して、検索拡張生成(RAG)における構造化マルチホップ推論を可能にする新しいフレームワークである。ReActのような既存のアプローチは、言語モデルのコンテキストウィンドウ内で推論チェーンを維持するが、我々はこれがしばしばプランの断片化と実行の失敗につながることを観察した。我々の重要な洞察は、推論計画をLMのワーキングメモリ外に有向非循環グラフ(DAG)として分離することで、(1)推論パスの系統的な探索、(2)正確な検索と接地が可能なアトミックサブクエリ、(3)並列実行とコンテキストウィンドウ利用による効率化を可能にすることである。さらに、Plan*RAGのモジュール設計は、既存のRAG手法との統合を可能にし、現在のRAGシステムを改善するための実用的なソリューションを提供する。標準的なマルチホップ推論ベンチマークにおいて、Plan*RAGはRQ-RAGやSelf-RAGのような最近提案された手法に対して、同等の計算コストを維持しながら一貫して改善を達成している。
要約(オリジナル)
We introduce Plan*RAG, a novel framework that enables structured multi-hop reasoning in retrieval-augmented generation (RAG) through test-time reasoning plan generation. While existing approaches such as ReAct maintain reasoning chains within the language model’s context window, we observe that this often leads to plan fragmentation and execution failures. Our key insight is that by isolating the reasoning plan as a directed acyclic graph (DAG) outside the LM’s working memory, we can enable (1) systematic exploration of reasoning paths, (2) atomic subqueries enabling precise retrievals and grounding, and (3) efficiency through parallel execution and bounded context window utilization. Moreover, Plan*RAG’s modular design allows it to be integrated with existing RAG methods, thus providing a practical solution to improve current RAG systems. On standard multi-hop reasoning benchmarks, Plan*RAG consistently achieves improvements over recently proposed methods such as RQ-RAG and Self-RAG, while maintaining comparable computational costs.
arxiv情報
著者 | Prakhar Verma,Sukruta Prakash Midigeshi,Gaurav Sinha,Arno Solin,Nagarajan Natarajan,Amit Sharma |
発行日 | 2025-02-04 15:30:36+00:00 |
arxivサイト | arxiv_id(pdf) |