Feature Representation Learning for NL2SQL Generation Based on Coupling and Decoupling

要約

NL2SQL タスクには、自然言語ステートメントを SQL クエリに解析することが含まれます。
ほとんどの最先端のメソッドは、NL2SQL をスロット充填タスクとして扱い、特徴表現学習テクニックを使用しますが、SELECT 句と WHERE 句の間の明示的な相関特徴や、単一の句内のサブタスク間の暗黙的な相関特徴を見落としています。
この問題に対処するために、Clause Feature Correlation Decoupling and Coupling (CFCDC) モデルを提案します。このモデルは、特徴表現の分離方法を使用して、パラメーター レベルで SELECT 句と WHERE 句を分離します。
次に、特定の句内の異なる SQL タスク間の暗黙的な相関特徴表現を分離するマルチタスク学習アーキテクチャを導入します。
さらに、SELECT 句と WHERE 句で分離されたタスクを統合し、最終的な SQL クエリを予測する、改良された機能表現結合モジュールを紹介します。
私たちが提案した CFCDC モデルは、WikiSQL データセット上で優れたパフォーマンスを示し、ロジック精度と実行精度が大幅に向上しました。
モデルのソース コードは GitHub で公開されます。

要約(オリジナル)

The NL2SQL task involves parsing natural language statements into SQL queries. While most state-of-the-art methods treat NL2SQL as a slot-filling task and use feature representation learning techniques, they overlook explicit correlation features between the SELECT and WHERE clauses and implicit correlation features between sub-tasks within a single clause. To address this issue, we propose the Clause Feature Correlation Decoupling and Coupling (CFCDC) model, which uses a feature representation decoupling method to separate the SELECT and WHERE clauses at the parameter level. Next, we introduce a multi-task learning architecture to decouple implicit correlation feature representation between different SQL tasks in a specific clause. Moreover, we present an improved feature representation coupling module to integrate the decoupled tasks in the SELECT and WHERE clauses and predict the final SQL query. Our proposed CFCDC model demonstrates excellent performance on the WikiSQL dataset, with significant improvements in logic precision and execution accuracy. The source code for the model will be publicly available on GitHub

arxiv情報

著者 Chenduo Hao,Xu Zhang,Chuanbao Gao,Deyu Zhou
発行日 2023-06-30 13:34:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク