要約
Text-to-SQLパーサーは、専門家でなくても簡単にリレーショナルデータを照会できるようにするために極めて重要である。これとは対照的に、このような構文解析器を訓練するには、一般に、自然言語(NL)の発話に対応するSQLクエリをアノテーションする専門知識が必要である。本研究では、テキストからSQLへのパーサを学習するための弱い監視アプローチを提案する。最近提案されたQDMRと呼ばれる質問の意味表現を利用する。質問、そのQDMR構造(非専門家によって注釈付けられたもの、あるいは自動的に予測されたもの)、そして回答が与えられた場合、テキストからSQLへの変換モデルの学習に使用されるSQLクエリを自動的に合成することができる。5つのベンチマークデータセットで実験することにより、本アプローチを検証する。その結果、弱教師付きモデルは、注釈付きNL-SQLデータで訓練したモデルと同等の性能を示すことがわかった。全体として、SQLアノテーションを使用せずに、テキストからSQLへのパーサーを効果的に学習することができる。
要約(オリジナル)
Text-to-SQL parsers are crucial in enabling non-experts to effortlessly query relational data. Training such parsers, by contrast, generally requires expertise in annotating natural language (NL) utterances with corresponding SQL queries. In this work, we propose a weak supervision approach for training text-to-SQL parsers. We take advantage of the recently proposed question meaning representation called QDMR, an intermediate between NL and formal query languages. Given questions, their QDMR structures (annotated by non-experts or automatically predicted), and the answers, we are able to automatically synthesize SQL queries that are used to train text-to-SQL models. We test our approach by experimenting on five benchmark datasets. Our results show that the weakly supervised models perform competitively with those trained on annotated NL-SQL data. Overall, we effectively train text-to-SQL parsers, while using zero SQL annotations.
arxiv情報
著者 | Tomer Wolfson,Daniel Deutch,Jonathan Berant |
発行日 | 2024-08-02 14:21:43+00:00 |
arxivサイト | arxiv_id(pdf) |