RAGONITE: Iterative Retrieval on Induced Databases and Verbalized RDF for Conversational QA over KGs with RAG

要約

会話型質問応答 (ConvQA) は、RDF ナレッジ グラフ (KG) を検索する便利な手段であり、自然言語の質問を SPARQL クエリに変換するアプローチが一般的です。
ただし、SPARQL にはいくつかの欠点があります。(i) 複雑な意図や会​​話的な質問には脆弱であり、(ii) より抽象的なニーズには適していません。
代わりに、我々は、(i) KG から自動的に導出されたデータベース上の SQL クエリ結果、および (ii) KG 事実の言語化上のテキスト検索結果を融合する、新しい 2 つの側面からなるシステムを提案します。
私たちのパイプラインは反復取得をサポートしています。いずれかの分岐の結果が満足のいくものではないことが判明した場合、システムは自動的にさらなるラウンドを選択できます。
すべてを検索拡張生成 (RAG) セットアップにまとめ、LLM が蓄積された検索結果から一貫した応答を生成します。
BMW 自動車のナレッジ グラフ上のいくつかのベースラインに対する提案システムの優位性を実証します。

要約(オリジナル)

Conversational question answering (ConvQA) is a convenient means of searching over RDF knowledge graphs (KGs), where a prevalent approach is to translate natural language questions to SPARQL queries. However, SPARQL has certain shortcomings: (i) it is brittle for complex intents and conversational questions, and (ii) it is not suitable for more abstract needs. Instead, we propose a novel two-pronged system where we fuse: (i) SQL-query results over a database automatically derived from the KG, and (ii) text-search results over verbalizations of KG facts. Our pipeline supports iterative retrieval: when the results of any branch are found to be unsatisfactory, the system can automatically opt for further rounds. We put everything together in a retrieval augmented generation (RAG) setup, where an LLM generates a coherent response from accumulated search results. We demonstrate the superiority of our proposed system over several baselines on a knowledge graph of BMW automobiles.

arxiv情報

著者 Rishiraj Saha Roy,Chris Hinze,Joel Schlotthauer,Farzad Naderi,Viktor Hangya,Andreas Foltyn,Luzian Hahn,Fabian Kuech
発行日 2024-12-24 11:03:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.IR パーマリンク