Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG

要約

大規模言語モデル(LLM)は、人間のようなテキスト生成と自然言語理解を可能にすることで、人工知能(AI)に革命をもたらした。しかし、静的な学習データに依存しているため、動的でリアルタイムのクエリに対応する能力が制限され、その結果、出力が古くなったり、不正確になったりする。検索拡張世代(RAG)は、文脈に関連した最新の応答を提供するために、リアルタイムのデータ検索を統合することによってLLMを強化するソリューションとして登場した。その期待にもかかわらず、従来のRAGシステムは静的なワークフローに制約されており、多段階の推論や複雑なタスク管理に必要な適応性に欠けている。 Agentic Retrieval-Augmented Generation(Agentic RAG)は、RAGパイプラインに自律型AIエージェントを組み込むことで、これらの制限を超越する。これらのエージェントは、検索戦略を動的に管理し、文脈理解を反復的に改良し、複雑なタスク要件に適合するようにワークフローを適応させるために、エージェント的な設計パターンの反映、計画、ツールの使用、およびマルチエージェントコラボレーションを活用する。この統合により、エージェント型RAGシステムは、比類のない柔軟性、拡張性、および多様なアプリケーションにわたるコンテキスト認識を提供することができる。 この調査は、RAGパラダイムの基礎原理と進化から始まり、Agentic RAGの包括的な探求を提供する。また、エージェント型RAGアーキテクチャの詳細な分類法を提示し、ヘルスケア、金融、教育などの業界における主要なアプリケーションを強調し、実用的な実装戦略を検討する。さらに、エージェント型RAGを実装するためのフレームワークやツールに関する詳細な洞察を提供しながら、これらのシステムのスケーリング、倫理的な意思決定の確保、実世界のアプリケーションのパフォーマンスの最適化における課題を取り上げている。

要約(オリジナル)

Large Language Models (LLMs) have revolutionized artificial intelligence (AI) by enabling human like text generation and natural language understanding. However, their reliance on static training data limits their ability to respond to dynamic, real time queries, resulting in outdated or inaccurate outputs. Retrieval Augmented Generation (RAG) has emerged as a solution, enhancing LLMs by integrating real time data retrieval to provide contextually relevant and up-to-date responses. Despite its promise, traditional RAG systems are constrained by static workflows and lack the adaptability required for multistep reasoning and complex task management. Agentic Retrieval-Augmented Generation (Agentic RAG) transcends these limitations by embedding autonomous AI agents into the RAG pipeline. These agents leverage agentic design patterns reflection, planning, tool use, and multiagent collaboration to dynamically manage retrieval strategies, iteratively refine contextual understanding, and adapt workflows to meet complex task requirements. This integration enables Agentic RAG systems to deliver unparalleled flexibility, scalability, and context awareness across diverse applications. This survey provides a comprehensive exploration of Agentic RAG, beginning with its foundational principles and the evolution of RAG paradigms. It presents a detailed taxonomy of Agentic RAG architectures, highlights key applications in industries such as healthcare, finance, and education, and examines practical implementation strategies. Additionally, it addresses challenges in scaling these systems, ensuring ethical decision making, and optimizing performance for real-world applications, while providing detailed insights into frameworks and tools for implementing Agentic RAG.

arxiv情報

著者 Aditi Singh,Abul Ehtesham,Saket Kumar,Tala Talaei Khoei
発行日 2025-02-03 04:01:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.CL, cs.IR パーマリンク