QFMTS: Generating Query-Focused Summaries over Multi-Table Inputs

要約

表の要約は、表形式のデータからの情報を簡潔でわかりやすいテキストの要約に凝縮することを目的とした重要なタスクです。
しかし、既存のアプローチでは、ユーザーの情報と品質の要件を適切に満たすことができないことが多く、現実世界のクエリの複雑さを見落とす傾向があります。
この論文では、クエリに焦点を当てた複数テーブルの要約を導入することで、これらの制限に対処する新しい方法を提案します。
私たちのアプローチは、テーブル直列化モジュール、要約コントローラー、大規模言語モデル (LLM) で構成され、テキスト クエリと複数のテーブルを利用して、ユーザーの情報ニーズに合わせたクエリ依存のテーブル要約を生成します。
この分野の研究を促進するために、このタスクに特化して調整された包括的なデータセットを提示します。このデータセットは、それぞれが複数のテーブルに関連付けられた 4909 個のクエリとサマリーのペアで構成されています。
厳選されたデータセットを使用した広範な実験を通じて、ベースラインのアプローチと比較して、提案された方法の有効性を実証します。
私たちの調査結果は、正確な要約を行うための複雑なテーブル推論の課題についての洞察を提供し、クエリに焦点を当てた複数テーブルの要約の研究の進歩に貢献します。

要約(オリジナル)

Table summarization is a crucial task aimed at condensing information from tabular data into concise and comprehensible textual summaries. However, existing approaches often fall short of adequately meeting users’ information and quality requirements and tend to overlook the complexities of real-world queries. In this paper, we propose a novel method to address these limitations by introducing query-focused multi-table summarization. Our approach, which comprises a table serialization module, a summarization controller, and a large language model (LLM), utilizes textual queries and multiple tables to generate query-dependent table summaries tailored to users’ information needs. To facilitate research in this area, we present a comprehensive dataset specifically tailored for this task, consisting of 4909 query-summary pairs, each associated with multiple tables. Through extensive experiments using our curated dataset, we demonstrate the effectiveness of our proposed method compared to baseline approaches. Our findings offer insights into the challenges of complex table reasoning for precise summarization, contributing to the advancement of research in query-focused multi-table summarization.

arxiv情報

著者 Weijia Zhang,Vaishali Pal,Jia-Hong Huang,Evangelos Kanoulas,Maarten de Rijke
発行日 2024-05-08 15:05:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク