A Multi-Source Retrieval Question Answering Framework Based on RAG

要約

大規模な言語モデルの急速な開発に伴い、検索拡張生成 (RAG) が広く採用されています。
しかし、既存の RAG パラダイムは、誤った検索情報の影響を避けられず、生成された結果の信頼性と正確性が低下します。
そこで本研究では、検索情報の関連性を高めるために、従来の検索機能を GPT-3.5 に置き換え、GPT-3.5 の膨大なコーパス知識を活用して検索情報を生成する手法を提案する。
また、GPT-3.5 の強力な推論機能を利用して問題の意味分割を実現する、きめ細かい知識検索を実装するための Web 検索ベースの方法も提案します。GPT 検索の錯覚を軽減し、Web 検索のノイズを減らすために、次のことを提案します。
GPT 検索と Web 検索を組み合わせた MSRAG という名前のマルチソース検索フレームワーク。
複数の知識集約型 QA データセットに関する実験により、この研究で提案されたフレームワークが、QA システムの全体的な効率と精度を向上させる点で既存の RAG フレームワークよりも優れたパフォーマンスを発揮することが実証されました。

要約(オリジナル)

With the rapid development of large-scale language models, Retrieval-Augmented Generation (RAG) has been widely adopted. However, existing RAG paradigms are inevitably influenced by erroneous retrieval information, thereby reducing the reliability and correctness of generated results. Therefore, to improve the relevance of retrieval information, this study proposes a method that replaces traditional retrievers with GPT-3.5, leveraging its vast corpus knowledge to generate retrieval information. We also propose a web retrieval based method to implement fine-grained knowledge retrieval, Utilizing the powerful reasoning capability of GPT-3.5 to realize semantic partitioning of problem.In order to mitigate the illusion of GPT retrieval and reduce noise in Web retrieval,we proposes a multi-source retrieval framework, named MSRAG, which combines GPT retrieval with web retrieval. Experiments on multiple knowledge-intensive QA datasets demonstrate that the proposed framework in this study performs better than existing RAG framework in enhancing the overall efficiency and accuracy of QA systems.

arxiv情報

著者 Ridong Wu,Shuhong Chen,Xiangbiao Su,Yuankai Zhu,Yifei Liao,Jianming Wu
発行日 2024-05-29 15:47:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.IR パーマリンク