SQLformer: Deep Auto-Regressive Query Graph Generation for Text-to-SQL Translation

要約

近年、自然言語の質問を実行可能な SQL クエリに変換するタスクである、テキストから SQL への変換への関心が高まっています。
このテクノロジーは、データベースからのデータ抽出を民主化する可能性があるため重要です。
ただし、その主なハードルには、これまで見たことのないデータベースに適応する能力であるドメインの一般化や、自然言語の質問と対応する SQL クエリの調整などが含まれます。
これらの課題を克服するために、テキストから SQL への変換タスクを実行するために特別に作成された新しい Transformer アーキテクチャである SQLformer を紹介します。
私たちのモデルは、エンコーダー層とデコーダー層に構造的な帰納的バイアスを組み込み、自己回帰的な方法で SQL クエリを抽象構文ツリー (AST) として予測します。
このバイアスは、データベースのテーブルと列の選択によって導かれ、デコーダが幅優先検索の正規順序でグラフとして表される SQL クエリ AST を生成するのに役立ちます。
包括的な実験により、広く使用されている 5 つの text-to-SQL ベンチマークにわたる SQLformer の最先端のパフォーマンスが示されています。
私たちの実装は https://github.com/AdrianBZG/SQLformer で入手できます。

要約(オリジナル)

In recent years, there has been growing interest in text-to-SQL translation, which is the task of converting natural language questions into executable SQL queries. This technology is important for its potential to democratize data extraction from databases. However, some of its key hurdles include domain generalisation, which is the ability to adapt to previously unseen databases, and alignment of natural language questions with the corresponding SQL queries. To overcome these challenges, we introduce SQLformer, a novel Transformer architecture specifically crafted to perform text-to-SQL translation tasks. Our model predicts SQL queries as abstract syntax trees (ASTs) in an autoregressive way, incorporating structural inductive bias in the encoder and decoder layers. This bias, guided by database table and column selection, aids the decoder in generating SQL query ASTs represented as graphs in a Breadth-First Search canonical order. Comprehensive experiments show the state-of-the-art performance of SQLformer across five widely used text-to-SQL benchmarks. Our implementation is available at https://github.com/AdrianBZG/SQLformer.

arxiv情報

著者 Adrián Bazaga,Pietro Liò,Gos Micklem
発行日 2024-04-15 02:26:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.LG パーマリンク