Decoupling SQL Query Hardness Parsing for Text-to-SQL

要約

Text-to-SQL タスクの基本的な目標は、自然言語の質問を SQL クエリに変換することです。
現在の研究では、主に自然言語の質問とスキーマの間の情報の結合に重点が置かれており、この分野では大きな進歩が見られます。
主要なタスク要件ソースとしての自然言語の質問は、対応する SQL クエリの難易度を決定します。この 2 つの間の相関関係は常に無視されます。
ただし、質問とクエリの相関関係が分離されると、タスクが簡素化される可能性があります。
このペーパーでは、SQL クエリ硬度解析の分離に基づいた Text-to-SQL の革新的なフレームワークを紹介します。
このフレームワークは、質問とスキーマを分析することにより、クエリの硬度に基づいて Text-to-SQL タスクを分離し、複数の硬度のタスクを単一の硬度の課題に簡素化します。
これにより、言語モデルに対する解析の負荷が大幅に軽減されます。
私たちは提案したフレームワークを評価し、Spider dev 上で微調整メソッドの新しい最先端のパフォーマンスを実現します。

要約(オリジナル)

The fundamental goal of the Text-to-SQL task is to translate natural language question into SQL query. Current research primarily emphasizes the information coupling between natural language questions and schemas, and significant progress has been made in this area. The natural language questions as the primary task requirements source determines the hardness of correspond SQL queries, the correlation between the two always be ignored. However, when the correlation between questions and queries was decoupled, it may simplify the task. In this paper, we introduce an innovative framework for Text-to-SQL based on decoupling SQL query hardness parsing. This framework decouples the Text-to-SQL task based on query hardness by analyzing questions and schemas, simplifying the multi-hardness task into a single-hardness challenge. This greatly reduces the parsing pressure on the language model. We evaluate our proposed framework and achieve a new state-of-the-art performance of fine-turning methods on Spider dev.

arxiv情報

著者 Jiawen Yi,Guo Chen
発行日 2023-12-11 07:20:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク