Enhancing Open-Domain Table Question Answering via Syntax- and Structure-aware Dense Retrieval

要約

オープンドメインのテーブル質問応答は、テーブルの大規模なコレクションから情報を取得および抽出することによって、質問に対する回答を提供することを目的としています。
オープンドメインテーブル QA の既存の研究は、テキスト検索手法を直接採用するか、テーブル検索のエンコード層でのみテーブル構造を考慮するため、テーブルのスコアリング中に構文および構造情報の損失が発生する可能性があります。
この問題に対処するために、オープンドメイン テーブル QA タスク用の構文および構造を意識した取得方法を提案します。
質問の構文表現を提供し、テーブルの構造ヘッダーと値表現を使用して、詳細な構文および構造情報の損失を回避します。
次に、構文から構造へのアグリゲーターを使用して、人間の検索プロセスを模倣して質問と候補テーブルの間の一致スコアを取得します。
実験結果は、私たちの方法が NQ テーブル データセットで最先端を達成し、新しく厳選されたオープン ドメイン Text-to-SQL データセットでは強力なベースラインを圧倒することを示しています。

要約(オリジナル)

Open-domain table question answering aims to provide answers to a question by retrieving and extracting information from a large collection of tables. Existing studies of open-domain table QA either directly adopt text retrieval methods or consider the table structure only in the encoding layer for table retrieval, which may cause syntactical and structural information loss during table scoring. To address this issue, we propose a syntax- and structure-aware retrieval method for the open-domain table QA task. It provides syntactical representations for the question and uses the structural header and value representations for the tables to avoid the loss of fine-grained syntactical and structural information. Then, a syntactical-to-structural aggregator is used to obtain the matching score between the question and a candidate table by mimicking the human retrieval process. Experimental results show that our method achieves the state-of-the-art on the NQ-tables dataset and overwhelms strong baselines on a newly curated open-domain Text-to-SQL dataset.

arxiv情報

著者 Nengzheng Jin,Dongfang Li,Junying Chen,Joanna Siebert,Qingcai Chen
発行日 2023-09-19 10:40:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク