DBLP-QuAD: A Question Answering Dataset over the DBLP Scholarly Knowledge Graph

要約

この作業では、DBLP 学術ナレッジ グラフ (KG) 上に質問応答データセットを作成します。
DBLP は、220 万人以上の著者によって発行された 440 万件を超える出版物をインデックス化した、主要なコンピューター サイエンス出版物に関する書誌情報のオンライン リファレンスです。
私たちのデータセットは、正しい回答を取得するために DBLP KG で実行できる、対応する SPARQL クエリを含む 10,000 の質問回答ペアで構成されています。
DBLP-QuAD は、最大の学術的質問応答データセットです。

要約(オリジナル)

In this work we create a question answering dataset over the DBLP scholarly knowledge graph (KG). DBLP is an on-line reference for bibliographic information on major computer science publications that indexes over 4.4 million publications published by more than 2.2 million authors. Our dataset consists of 10,000 question answer pairs with the corresponding SPARQL queries which can be executed over the DBLP KG to fetch the correct answer. DBLP-QuAD is the largest scholarly question answering dataset.

arxiv情報

著者 Debayan Banerjee,Sushil Awale,Ricardo Usbeck,Chris Biemann
発行日 2023-03-28 09:47:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.DL パーマリンク