RAG-based Question Answering over Heterogeneous Data and Text

要約

この記事では、すべてのソースを統一的に扱い、非構造化テキスト、構造化テーブル、ナレッジ グラフに対する質問応答を行う QUASAR システムについて説明します。
このシステムは RAG ベースのアーキテクチャを採用しており、証拠の検索とそれに続く回答生成のパイプラインを備えており、後者は中規模の言語モデルによって強化されています。
さらに、QUASAR には、質問を理解するためのコンポーネントがあり、証拠を取得するためのより鮮明な入力を導き出し、最も有益な情報を回答生成に供給する前に、取得した証拠を再ランク付けおよびフィルタリングするためのコンポーネントがあります。
3 つの異なるベンチマークを使用した実験では、計算コストとエネルギー消費量を桁違いに低く抑えながら、大規模な GPT モデルと同等かそれ以上の高い応答品質を示すこのアプローチの応答品質が実証されました。

要約(オリジナル)

This article presents the QUASAR system for question answering over unstructured text, structured tables, and knowledge graphs, with unified treatment of all sources. The system adopts a RAG-based architecture, with a pipeline of evidence retrieval followed by answer generation, with the latter powered by a moderate-sized language model. Additionally and uniquely, QUASAR has components for question understanding, to derive crisper input for evidence retrieval, and for re-ranking and filtering the retrieved evidence before feeding the most informative pieces into the answer generation. Experiments with three different benchmarks demonstrate the high answering quality of our approach, being on par with or better than large GPT models, while keeping the computational cost and energy consumption orders of magnitude lower.

arxiv情報

著者 Philipp Christmann,Gerhard Weikum
発行日 2024-12-10 11:18:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.IR パーマリンク