Interactive Text-to-SQL Generation via Editable Step-by-Step Explanations

要約

ビッグデータ時代において、リレーショナルデータベースは重要な役割を担っています。しかし、専門家でなくてもSQLなどのデータベース言語に精通していないため、リレーショナルデータベースの分析力を十分に発揮させることは困難である。自然言語からSQLを自動生成する技術は数多く提案されているが、(1)特に複雑なクエリに対して多くの誤りを犯す、(2)専門家ではないユーザが誤ったクエリを検証し改良するための柔軟な方法を提供しない、という2つの問題に苦しんでいる。これらの問題を解決するために、我々は、SQLエラーを修正するために、間違ったSQLのステップバイステップの説明をユーザが直接編集できる新しいインタラクション機構を導入する。Spiderベンチマークを用いた実験では、我々のアプローチが3つのSOTAアプローチを実行精度の点で少なくとも31.6%上回ることが示された。さらに、24人の参加者を対象としたユーザ調査では、本アプローチが、より少ない時間と高い信頼性で、有意に多くのSQLタスクの解決を支援することが示され、特に非専門家のデータベースへのアクセスを拡大する可能性が示された。

要約(オリジナル)

Relational databases play an important role in this Big Data era. However, it is challenging for non-experts to fully unleash the analytical power of relational databases, since they are not familiar with database languages such as SQL. Many techniques have been proposed to automatically generate SQL from natural language, but they suffer from two issues: (1) they still make many mistakes, particularly for complex queries, and (2) they do not provide a flexible way for non-expert users to validate and refine the incorrect queries. To address these issues, we introduce a new interaction mechanism that allows users directly edit a step-by-step explanation of an incorrect SQL to fix SQL errors. Experiments on the Spider benchmark show that our approach outperforms three SOTA approaches by at least 31.6% in terms of execution accuracy. A user study with 24 participants further shows that our approach helped users solve significantly more SQL tasks with less time and higher confidence, demonstrating its potential to expand access to databases, particularly for non-experts.

arxiv情報

著者 Yuan Tian,Toby Jia-Jun Li,Jonathan K. Kummerfeld,Tianyi Zhang
発行日 2023-05-12 10:45:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CL, cs.DB, I.2.7 パーマリンク