RESDSQL: Decoupling Schema Linking and Skeleton Parsing for Text-to-SQL

要約

Text-to-SQL の最近の最良の試みの 1 つは、事前トレーニング済みの言語モデルです。
SQL クエリの構造特性により、seq2seq モデルは、スキーマ アイテム (つまり、テーブルと列) とスケルトン (つまり、SQL キーワード) の両方を解析する責任を負います。
このように結合されたターゲットは、特に多くのスキーマ項目と論理演算子が関係する場合に、正しい SQL クエリを解析することの難しさを増します。
この論文では、スキーマのリンクとスケルトンの解析を切り離すために、ランキング強化されたエンコーディングとスケルトン対応のデコーディング フレームワークを提案します。
具体的には、seq2seq エンコーダー デコード モデルの場合、そのエンコーダーは、順序付けられていないスキーマ項目全体ではなく、最も関連性の高いスキーマ項目によって注入されます。これにより、SQL 解析中のスキーマ リンク作業が軽減され、デコーダーは最初にスケルトンを生成し、次に実際の SQL
これにより、SQL 解析が暗黙的に制約される可能性があります。
Spider とその 3 つの堅牢性バリアント (Spider-DK、Spider-Syn、Spider-Realistic) で提案されたフレームワークを評価します。
実験結果は、私たちのフレームワークが有望なパフォーマンスと堅牢性を提供することを示しています。
コードは https://github.com/RUCKBReasoning/RESDSQL で入手できます。

要約(オリジナル)

One of the recent best attempts at Text-to-SQL is the pre-trained language model. Due to the structural property of the SQL queries, the seq2seq model takes the responsibility of parsing both the schema items (i.e., tables and columns) and the skeleton (i.e., SQL keywords). Such coupled targets increase the difficulty of parsing the correct SQL queries especially when they involve many schema items and logic operators. This paper proposes a ranking-enhanced encoding and skeleton-aware decoding framework to decouple the schema linking and the skeleton parsing. Specifically, for a seq2seq encoder-decode model, its encoder is injected by the most relevant schema items instead of the whole unordered ones, which could alleviate the schema linking effort during SQL parsing, and its decoder first generates the skeleton and then the actual SQL query, which could implicitly constrain the SQL parsing. We evaluate our proposed framework on Spider and its three robustness variants: Spider-DK, Spider-Syn, and Spider-Realistic. The experimental results show that our framework delivers promising performance and robustness. Our code is available at https://github.com/RUCKBReasoning/RESDSQL.

arxiv情報

著者 Haoyang Li,Jing Zhang,Cuiping Li,Hong Chen
発行日 2023-02-22 16:05:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク