A Universal Question-Answering Platform for Knowledge Graphs

要約

さまざまなアプリケーション ドメインからのナレッジはナレッジ グラフ (KG) として編成され、SPARQL エンドポイントを介して Web でアクセス可能な RDF エンジンに格納されます。
整形式の SPARQL クエリを表現するには、グラフ構造とそのコンポーネントの正確な URI に関する情報が必要ですが、これは平均的なユーザーには非現実的です。
質問応答 (QA) システムは、自然言語の質問を SPARQL に変換することで支援します。
既存の QA システムは通常、アプリケーション固有の人間がキュレーションしたルールに基づいているか、対象となる KG ごとに事前情報、高価な前処理、およびモデルの適応を必要とします。
したがって、幅広いアプリケーションや KG に一般化することは困難です。
この論文では、各ターゲットKGに合わせて調整する必要のないユニバーサルQAシステムであるKGQAnを提案します。
厳選されたルールの代わりに、KGQAn は質問理解の新しい形式化をテキスト生成問題として導入し、ニューラル シーケンス間モデルを介して質問を中間抽象表現に変換します。
また、公開されている API と RDF ストアの既存のインデックスのみを使用して、前処理を必要とせずに、クエリ時に抽象表現を特定の KG の SPARQL クエリにマップするジャストインタイム リンカも開発しています。
いくつかの実際の KG を使用した実験では、KGQAn が簡単に展開され、特にトレーニング中に見えない任意の KG の場合、回答の品質と処理時間の点で最新技術を大幅に上回ることが実証されています。

要約(オリジナル)

Knowledge from diverse application domains is organized as knowledge graphs (KGs) that are stored in RDF engines accessible in the web via SPARQL endpoints. Expressing a well-formed SPARQL query requires information about the graph structure and the exact URIs of its components, which is impractical for the average user. Question answering (QA) systems assist by translating natural language questions to SPARQL. Existing QA systems are typically based on application-specific human-curated rules, or require prior information, expensive pre-processing and model adaptation for each targeted KG. Therefore, they are hard to generalize to a broad set of applications and KGs. In this paper, we propose KGQAn, a universal QA system that does not need to be tailored to each target KG. Instead of curated rules, KGQAn introduces a novel formalization of question understanding as a text generation problem to convert a question into an intermediate abstract representation via a neural sequence-to-sequence model. We also develop a just-in-time linker that maps at query time the abstract representation to a SPARQL query for a specific KG, using only the publicly accessible APIs and the existing indices of the RDF store, without requiring any pre-processing. Our experiments with several real KGs demonstrate that KGQAn is easily deployed and outperforms by a large margin the state-of-the-art in terms of quality of answers and processing time, especially for arbitrary KGs, unseen during the training.

arxiv情報

著者 Reham Omar,Ishika Dhall,Panos Kalnis,Essam Mansour
発行日 2023-03-01 15:35:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.DB パーマリンク