要約
Text-to-SQL システムは、自然言語クエリを SQL (Structured Query Language) に変換することでデータベースとのスムーズな対話を促進し、技術者以外のユーザーと複雑なデータベース管理システムの間のギャップを埋めます。
この調査では、AI 主導の text-to-SQL システムの進化の包括的な概要を提供し、その基本コンポーネント、大規模言語モデル (LLM) アーキテクチャの進歩、およびシステムにおける Spider、WikiSQL、CoSQL などのデータセットの重要な役割に焦点を当てています。
進歩を推進します。
私たちは、医療、教育、金融などの分野における Text-to-SQL のアプリケーションを調査し、データ アクセシビリティを向上させる変革の可能性を強調します。
さらに、ドメインの一般化、クエリの最適化、マルチターンの会話インタラクションのサポート、NoSQL データベースや動的な現実世界のシナリオに合わせて調整されたデータセットの可用性の制限など、永続的な課題を分析します。
これらの課題に対処するために、NoSQL データベースをサポートするための text-to-SQL 機能の拡張、動的なマルチターン インタラクションのためのデータセットの設計、現実世界のスケーラビリティと堅牢性のためのシステムの最適化など、将来の研究の方向性を概説します。
このペーパーは、現在の進歩を調査し、主要なギャップを特定することにより、LLM ベースの text-to-SQL システムにおける次世代の研究とアプリケーションを導くことを目的としています。
要約(オリジナル)
Text-to-SQL systems facilitate smooth interaction with databases by translating natural language queries into Structured Query Language (SQL), bridging the gap between non-technical users and complex database management systems. This survey provides a comprehensive overview of the evolution of AI-driven text-to-SQL systems, highlighting their foundational components, advancements in large language model (LLM) architectures, and the critical role of datasets such as Spider, WikiSQL, and CoSQL in driving progress. We examine the applications of text-to-SQL in domains like healthcare, education, and finance, emphasizing their transformative potential for improving data accessibility. Additionally, we analyze persistent challenges, including domain generalization, query optimization, support for multi-turn conversational interactions, and the limited availability of datasets tailored for NoSQL databases and dynamic real-world scenarios. To address these challenges, we outline future research directions, such as extending text-to-SQL capabilities to support NoSQL databases, designing datasets for dynamic multi-turn interactions, and optimizing systems for real-world scalability and robustness. By surveying current advancements and identifying key gaps, this paper aims to guide the next generation of research and applications in LLM-based text-to-SQL systems.
arxiv情報
著者 | Aditi Singh,Akash Shetty,Abul Ehtesham,Saket Kumar,Tala Talaei Khoei |
発行日 | 2024-12-06 17:36:28+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google