Interactive Text-to-SQL Generation via Editable Step-by-Step Explanations

要約

リレーショナル データベースは、このビッグ データ時代において重要な役割を果たします。
ただし、専門家以外は SQL などのデータベース言語に慣れていないため、リレーショナル データベースの分析能力を最大限に発揮することは困難です。
自然言語から SQL を自動的に生成するための多くの技術が提案されていますが、それらには次の 2 つの問題があります。(1) 依然として多くの間違いがあり、特に複雑なクエリの場合、(2) 専門家以外のユーザーに柔軟な方法が提供されていません。
間違ったクエリを検証して修正します。
これらの問題に対処するために、ユーザーが間違った SQL のステップごとの説明を直接編集して SQL エラーを修正できる、新しい対話メカニズムを導入しました。
Spider ベンチマークの実験では、実行精度の点で、私たちのアプローチが 3 つの SOTA アプローチよりも少なくとも 31.6% 優れていることが示されています。
さらに、24 人の参加者を対象としたユーザー調査では、私たちのアプローチにより、ユーザーがより多くの SQL タスクをより短時間でより高い自信を持って解決できることが示され、特に専門家以外のデータベースへのアクセスを拡大する可能性があることが実証されました。

要約(オリジナル)

Relational databases play an important role in this Big Data era. However, it is challenging for non-experts to fully unleash the analytical power of relational databases, since they are not familiar with database languages such as SQL. Many techniques have been proposed to automatically generate SQL from natural language, but they suffer from two issues: (1) they still make many mistakes, particularly for complex queries, and (2) they do not provide a flexible way for non-expert users to validate and refine the incorrect queries. To address these issues, we introduce a new interaction mechanism that allows users directly edit a step-by-step explanation of an incorrect SQL to fix SQL errors. Experiments on the Spider benchmark show that our approach outperforms three SOTA approaches by at least 31.6% in terms of execution accuracy. A user study with 24 participants further shows that our approach helped users solve significantly more SQL tasks with less time and higher confidence, demonstrating its potential to expand access to databases, particularly for non-experts.

arxiv情報

著者 Yuan Tian,Zheng Zhang,Zheng Ning,Toby Jia-Jun Li,Jonathan K. Kummerfeld,Tianyi Zhang
発行日 2023-12-07 06:34:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.DB, I.2.7 パーマリンク