Open-WikiTable: Dataset for Open Domain Question Answering with Complex Reasoning over Table

要約

最近、テーブルを用いたオープンドメイン質問応答(ODQA)が注目されているが、多くの研究は、テーブルの構造的性質を利用したタスクに真に最適とはいえないデータセットに依存している。これらのデータセットでは、回答は1つのセルの値として存在し、集計、比較、ソートといった複数のセルに関する探索は必要ないものとなっています。そこで、Open-WikiTableをリリースします。ODQA初のデータセットで、テーブルを使った複雑な推論を必要とします。Open-WikiTableは、WikiSQLとWikiTableQuestionsをベースに構築されており、オープンドメインで適用可能です。各質問はテキストによる回答とSQLクエリの両方と結合しているため、Open-WikiTableはリーダーおよびパーサーの両方の方法を適用することができ、将来の研究の可能性を大きく広げます。データセットとコードは一般に公開されています。

要約(オリジナル)

Despite recent interest in open domain question answering (ODQA) over tables, many studies still rely on datasets that are not truly optimal for the task with respect to utilizing structural nature of table. These datasets assume answers reside as a single cell value and do not necessitate exploring over multiple cells such as aggregation, comparison, and sorting. Thus, we release Open-WikiTable, the first ODQA dataset that requires complex reasoning over tables. Open-WikiTable is built upon WikiSQL and WikiTableQuestions to be applicable in the open-domain setting. As each question is coupled with both textual answers and SQL queries, Open-WikiTable opens up a wide range of possibilities for future research, as both reader and parser methods can be applied. The dataset and code are publicly available.

arxiv情報

著者 Sunjun Kweon,Yeonsu Kwon,Seonhee Cho,Yohan Jo,Edward Choi
発行日 2023-05-12 07:24:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CL パーマリンク