RoundTable: Leveraging Dynamic Schema and Contextual Autocomplete for Enhanced Query Precision in Tabular Question Answering

要約

大規模言語モデル (LLM) の進歩により、平易な英語でデータベースにクエリを実行し、ユーザーの質問を実行可能なデータベース クエリに変換する主な使用例が出現し、これは大幅に改善されました。
ただし、現実世界のデータセットには膨大な数の属性や複雑な値が含まれることが多く、自然言語クエリから関連する列や値を正確に特定するという LLM のタスクが複雑になります。
従来の方法では、データセットのサイズと複雑さを LLM に完全に中継することができません。
これらの課題に対処するために、入力テーブルで全文検索 (FTS) を活用する新しいフレームワークを提案します。
このアプローチにより、特定の値と列の正確な検出が可能になるだけでなく、言語モデルの検索スペースが狭まり、それによってクエリの精度が向上します。
さらに、テーブル内のデータに基づいてクエリを提案するカスタム オートコンプリート機能もサポートしています。
この統合により、ユーザーと複雑なデータセット間の対話が大幅に改善され、現在のテーブル クエリ機能が直面する制限に対する高度なソリューションが提供されます。
この作品には Mac と Windows の両方のプラットフォーム用のアプリケーションが付属しており、読者は自分のデータで試してみることができます。

要約(オリジナル)

With advancements in Large Language Models (LLMs), a major use case that has emerged is querying databases in plain English, translating user questions into executable database queries, which has improved significantly. However, real-world datasets often feature a vast array of attributes and complex values, complicating the LLMs task of accurately identifying relevant columns or values from natural language queries. Traditional methods cannot fully relay the datasets size and complexity to the LLM. To address these challenges, we propose a novel framework that leverages Full-Text Search (FTS) on the input table. This approach not only enables precise detection of specific values and columns but also narrows the search space for language models, thereby enhancing query accuracy. Additionally, it supports a custom auto-complete feature that suggests queries based on the data in the table. This integration significantly refines the interaction between the user and complex datasets, offering a sophisticated solution to the limitations faced by current table querying capabilities. This work is accompanied by an application for both Mac and Windows platforms, which readers can try out themselves on their own data.

arxiv情報

著者 Pratyush Kumar,Kuber Vijaykumar Bellad,Bharat Vadlamudi,Aman Chadha
発行日 2024-08-22 13:13:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI パーマリンク