QTSumm: A New Benchmark for Query-Focused Table Summarization


このペーパーでは、クエリに焦点を当てた新しいテーブル要約タスクを定義します。このタスクでは、テキスト生成モデルが指定されたテーブルに対して人間のような推論と分析を実行して、カスタマイズされた要約を生成する必要があります。また、このタスク用に QTSumm という新しいベンチマークを導入します。
QTSumm は、さまざまなトピックに関する 2,437 のテーブルにわたる、人による注釈が付けられた 5,625 のクエリと要約のペアで構成されています。
さらに、QTSumm データセット上の最先端のモデル (つまり、テキスト生成、表からテキストへの生成、大規模言語モデル) を調査します。


People primarily consult tables to conduct data analysis or answer specific questions. Text generation systems that can provide accurate table summaries tailored to users’ information needs can facilitate more efficient access to relevant data insights. However, existing table-to-text generation studies primarily focus on converting tabular data into coherent statements, rather than addressing information-seeking purposes. In this paper, we define a new query-focused table summarization task, where text generation models have to perform human-like reasoning and analysis over the given table to generate a tailored summary, and we introduce a new benchmark named QTSumm for this task. QTSumm consists of 5,625 human-annotated query-summary pairs over 2,437 tables on diverse topics. Moreover, we investigate state-of-the-art models (i.e., text generation, table-to-text generation, and large language models) on the QTSumm dataset. Experimental results and manual analysis reveal that our benchmark presents significant challenges in table-to-text generation for future research.


著者 Yilun Zhao,Zhenting Qi,Linyong Nan,Boyu Mi,Yixin Liu,Weijin Zou,Simeng Han,Xiangru Tang,Yumo Xu,Arman Cohan,Dragomir Radev
発行日 2023-05-23 17:43:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク