A Survey on Employing Large Language Models for Text-to-SQL Tasks


リレーショナル データベースに保存されるデータ量の増加により、さまざまな分野でこのデータを効率的にクエリして利用する必要性が生じています。
ただし、SQL クエリの作成には専門的な知識が必要であり、データベースにアクセスしてクエリを実行しようとする専門家以外のユーザーにとっては困難が伴います。
Text-to-SQL 解析は、自然言語クエリを SQL クエリに変換することでこの問題を解決し、専門知識のないユーザーでもデータベースにアクセスしやすくします。
大規模言語モデル (LLM) の最近の開発を活用するために、迅速なエンジニアリングと微調整に主に焦点を当てた、さまざまな新しい手法が登場しました。
この調査では、テキストから SQL へのタスクにおける LLM の包括的な概要を提供し、ベンチマーク データセット、プロンプト エンジニアリング、微調整方法、および将来の研究の方向性について説明します。


The increasing volume of data stored in relational databases has led to the need for efficient querying and utilization of this data in various sectors. However, writing SQL queries requires specialized knowledge, which poses a challenge for non-professional users trying to access and query databases. Text-to-SQL parsing solves this issue by converting natural language queries into SQL queries, thus making database access more accessible for non-expert users. To take advantage of the recent developments in Large Language Models (LLMs), a range of new methods have emerged, with a primary focus on prompt engineering and fine-tuning. This survey provides a comprehensive overview of LLMs in text-to-SQL tasks, discussing benchmark datasets, prompt engineering, fine-tuning methods, and future research directions. We hope this review will enable readers to gain a broader understanding of the recent advances in this field and offer some insights into its future trajectory.


著者 Liang Shi,Zhengju Tang,Nan Zhang,Xiaotong Zhang,Zhi Yang
発行日 2024-09-09 06:17:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク