RH-SQL: Refined Schema and Hardness Prompt for Text-to-SQL

要約

Text-to-SQL は、自然言語クエリを構造化クエリ言語 SQL に変換するテクノロジーです。
最近注目を集めている新しい研究アプローチは、SQL クエリの複雑さに基づく方法に焦点を当てており、顕著なパフォーマンスの向上を実現しています。
しかし、既存の方法では保管とトレーニングに多大なコストがかかり、実際の応用が妨げられています。
この問題に対処するために、この文書では、洗練されたスキーマとハードネス プロンプトに基づいた Text-to-SQL の方法を紹介します。
この方法では、洗練されたスキーマで関連性の低いスキーマ情報をフィルタリングし、プロンプトを形成するための言語モデル (LM) を通じてクエリの難易度を特定することで、パフォーマンスを維持しながらストレージとトレーニングのコストを削減します。
この方法は任意のシーケンス間 (seq2seq) LM に適用できることに注意してください。
Spider データセット、特に大規模 LM での実験では、82.6% という優れた実行精度 (EX) を達成し、現実世界のアプリケーションに対する私たちの手法の有効性とより高い適合性を実証しました。

要約(オリジナル)

Text-to-SQL is a technology that converts natural language queries into the structured query language SQL. A novel research approach that has recently gained attention focuses on methods based on the complexity of SQL queries, achieving notable performance improvements. However, existing methods entail significant storage and training costs, which hampers their practical application. To address this issue, this paper introduces a method for Text-to-SQL based on Refined Schema and Hardness Prompt. By filtering out low-relevance schema information with a refined schema and identifying query hardness through a Language Model (LM) to form prompts, this method reduces storage and training costs while maintaining performance. It’s worth mentioning that this method is applicable to any sequence-to-sequence (seq2seq) LM. Our experiments on the Spider dataset, specifically with large-scale LMs, achieved an exceptional Execution accuracy (EX) of 82.6%, demonstrating the effectiveness and greater suitability of our method for real-world applications.

arxiv情報

著者 Jiawen Yi,Guo Chen,Zixiang Shen
発行日 2024-06-13 14:04:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク