Multi-Meta-RAG: Improving RAG for Multi-Hop Queries using Database Filtering with LLM-Extracted Metadata

要約

検索拡張生成 (RAG) により、外部の知識ソースから関連情報を取得できるようになり、大規模言語モデル (LLM) がこれまでに見たことのない文書コレクションに対するクエリに応答できるようになります。
ただし、従来の RAG アプリケーションは、裏付けとなる証拠の複数の要素を取得して推論する必要があるマルチホップの質問に答える際にパフォーマンスが低いことが実証されています。
Multi-Meta-RAG と呼ばれる新しい方法を導入します。これは、LLM で抽出されたメタデータによるデータベース フィルタリングを使用して、質問に関連するさまざまなソースから関連ドキュメントの RAG 選択を改善します。
データベース フィルタリングは特定のドメインおよび形式からの一連の質問に固有ですが、Multi-Meta-RAG により MultiHop-RAG ベンチマークの結果が大幅に向上することがわかりました。
コードは https://github.com/mxpoliakov/Multi-Meta-RAG で入手できます。

要約(オリジナル)

The retrieval-augmented generation (RAG) enables retrieval of relevant information from an external knowledge source and allows large language models (LLMs) to answer queries over previously unseen document collections. However, it was demonstrated that traditional RAG applications perform poorly in answering multi-hop questions, which require retrieving and reasoning over multiple elements of supporting evidence. We introduce a new method called Multi-Meta-RAG, which uses database filtering with LLM-extracted metadata to improve the RAG selection of the relevant documents from various sources, relevant to the question. While database filtering is specific to a set of questions from a particular domain and format, we found out that Multi-Meta-RAG greatly improves the results on the MultiHop-RAG benchmark. The code is available at https://github.com/mxpoliakov/Multi-Meta-RAG.

arxiv情報

著者 Mykhailo Poliakov,Nadiya Shvai
発行日 2024-08-19 11:38:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.DB パーマリンク