Error Detection for Text-to-SQL Semantic Parsing

要約

近年、テキストから SQL へのセマンティック解析は目覚ましい進歩を遂げていますが、既存のパーサーのパフォーマンスは依然として完璧には程遠いです。
特に、深層学習に基づいた最新のテキストから SQL へのパーサーは自信過剰であることが多く、実際に使用する際にその信頼性に疑問が生じます。
この論文では、テキストから SQL へのセマンティック解析のための、パーサーに依存しないエラー検出モデルを提案します。
コードの言語モデルを基盤として使用し、自然言語の質問と SQL クエリの両方の構造的特徴を学習するグラフ ニューラル ネットワークでエラー検出モデルを強化します。
クロスドメイン設定から収集された現実的な解析エラーに基づいてモデルをトレーニングすることで、汎化能力の強化につながります。
異なるデコードメカニズムを備えた 3 つの強力な text-to-SQL パーサーを使用した実験では、私たちのアプローチがパーサーに依存する不確実性メトリクスよりも優れていることがわかりました。
私たちのモデルは、アーキテクチャに関係なく、text-to-SQL セマンティック パーサーのパフォーマンスと使いやすさを効果的に向上させることもできます。
(私たちの実装は https://github.com/OSU-NLP-Group/Text2SQL-Error-Detection で入手できます)

要約(オリジナル)

Despite remarkable progress in text-to-SQL semantic parsing in recent years, the performance of existing parsers is still far from perfect. Specifically, modern text-to-SQL parsers based on deep learning are often over-confident, thus casting doubt on their trustworthiness when deployed for real use. In this paper, we propose a parser-independent error detection model for text-to-SQL semantic parsing. Using a language model of code as its bedrock, we enhance our error detection model with graph neural networks that learn structural features of both natural language questions and SQL queries. We train our model on realistic parsing errors collected from a cross-domain setting, which leads to stronger generalization ability. Experiments with three strong text-to-SQL parsers featuring different decoding mechanisms show that our approach outperforms parser-dependent uncertainty metrics. Our model could also effectively improve the performance and usability of text-to-SQL semantic parsers regardless of their architectures. (Our implementation is available at https://github.com/OSU-NLP-Group/Text2SQL-Error-Detection)

arxiv情報

著者 Shijie Chen,Ziru Chen,Huan Sun,Yu Su
発行日 2023-12-06 14:09:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク