要約
文脈依存型Text-to-SQLは、多回転する自然言語の質問をSQLクエリに変換することを目的としている。様々な手法が文脈依存SQL構文解析のために文脈依存情報を暗黙的に利用してきたにもかかわらず、現在の質問と質問文脈の間の依存関係を明示的に扱う試みはほとんどない。本論文では、モデルが適切な文脈理解を達成するのを助ける、新しいQuestion Rewriting GuidedアプローチであるQURGを提示する。具体的には、まず、質問文脈に基づいて現在の質問を完成させる質問書き換えモデルを訓練し、それらを書き換え編集マトリックスに変換する。さらに、質問と文脈の間の書き換え関係と、自然言語と構造化スキーマの間のスキーマリンク関係を共同でモデル化するために、2ストリームマトリクスエンコーダを設計します。実験の結果、QURGは文脈に依存する2つの大規模データセットSParCとCoSQLにおいて、特に難解で長回しの質問に対する性能を大幅に向上させることがわかった。
要約(オリジナル)
Context-dependent Text-to-SQL aims to translate multi-turn natural language questions into SQL queries. Despite various methods have exploited context-dependence information implicitly for contextual SQL parsing, there are few attempts to explicitly address the dependencies between current question and question context. This paper presents QURG, a novel Question Rewriting Guided approach to help the models achieve adequate contextual understanding. Specifically, we first train a question rewriting model to complete the current question based on question context, and convert them into a rewriting edit matrix. We further design a two-stream matrix encoder to jointly model the rewriting relations between question and context, and the schema linking relations between natural language and structured schema. Experimental results show that QURG significantly improves the performances on two large-scale context-dependent datasets SParC and CoSQL, especially for hard and long-turn questions.
arxiv情報
著者 | Linzheng Chai,Dongling Xiao,Jian Yang,Liqun Yang,Qian-Wen Zhang,Yunbo Cao,Zhoujun Li,Zhao Yan |
発行日 | 2023-05-11 08:45:55+00:00 |
arxivサイト | arxiv_id(pdf) |