Localize, Retrieve and Fuse: A Generalized Framework for Free-Form Question Answering over Tables

要約

表形式データに関する質問応答 (別名 TableQA) は、提供された表に基づいて質問に対する回答を生成することを目的としており、最近大きな注目を集めています。
従来の研究では主に、個々のまたは限られた表のセルからの情報抽出を通じて簡潔な事実に基づく応答が生成され、多様な表のセルにわたって推論する能力が欠けていました。
しかし、自由形式の TableQA の領域は、関連するテーブル セルを選択するための複雑な戦略と、個別のデータ フラグメントの高度な統合と推論を必要とし、ほとんど未踏のままです。
この目的を達成するために、この論文では一般化された 3 段階のアプローチを提案します。表からグラフへの変換とセルの位置特定、外部知識の取得、および表とテキストの融合 (TAG-QA と呼ばれます) で、長い空きデータを推論するという課題に対処します。
-生成された TableQA で回答を作成します。
特に、TAG-QA は、(1) グラフ ニューラル ネットワークを使用して関連する表のセルを特定し、関連する行と列の間で交差するセルを収集し、(2) Wikipedia からの外部知識を活用し、(3) 表形式データと自然データの両方を統合して回答を生成します。
言語情報。
実験では、特にいくつかの最先端のベースラインと比較した場合、忠実かつ一貫性のある文章を生成する TAG-QA の優れた機能が実証されました。
特に、TAG-QA は、BLEU-4 スコアと PARENT F スコアの点で、堅牢なパイプライン ベースのベースライン TAPAS をそれぞれ 17% と 14% 上回っています。
さらに、TAG-QA は、BLEU-4 および PARENT F スコアで、エンドツーエンド モデル T5 をそれぞれ 16% および 12% 上回っています。

要約(オリジナル)

Question answering on tabular data (a.k.a TableQA), which aims at generating answers to questions grounded on a provided table, has gained significant attention recently. Prior work primarily produces concise factual responses through information extraction from individual or limited table cells, lacking the ability to reason across diverse table cells. Yet, the realm of free-form TableQA, which demands intricate strategies for selecting relevant table cells and the sophisticated integration and inference of discrete data fragments, remains mostly unexplored. To this end, this paper proposes a generalized three-stage approach: Table-to- Graph conversion and cell localizing, external knowledge retrieval, and the fusion of table and text (called TAG-QA), to address the challenge of inferring long free-form answers in generative TableQA. In particular, TAG-QA (1) locates relevant table cells using a graph neural network to gather intersecting cells between relevant rows and columns, (2) leverages external knowledge from Wikipedia, and (3) generates answers by integrating both tabular data and natural linguistic information. Experiments showcase the superior capabilities of TAG-QA in generating sentences that are both faithful and coherent, particularly when compared to several state-of-the-art baselines. Notably, TAG-QA surpasses the robust pipeline-based baseline TAPAS by 17% and 14% in terms of BLEU-4 and PARENT F-score, respectively. Furthermore, TAG-QA outperforms the end-to-end model T5 by 16% and 12% on BLEU-4 and PARENT F-score, respectively.

arxiv情報

著者 Wenting Zhao,Ye Liu,Yao Wan,Yibo Wang,Zhongfen Deng,Philip S. Yu
発行日 2023-09-21 10:57:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク