SUQL: Conversational Search over Structured and Unstructured Data with Large Language Models

要約

多くの知識ソースは、リレーショナル データベースなどの構造化情報と非構造化フリー テキストの両方で構成されています。
このようなデータ ソースへの会話型インターフェイスを構築するのは困難です。
このペーパーでは、構造化および非構造化データ クエリの構成を自然にカバーする最初の正式な実行可能表現である SUQL (構造化および非構造化クエリ言語) を紹介します。
具体的には、SQL をいくつかのフリーテキスト プリミティブで拡張して、正確で簡潔で表現力豊かな表現を形成します。
この論文では、SUQL 用の数ショットのコンテキスト セマンティック パーサーを含む、大規模な言語モデルに基づく会話型検索エージェントについても説明します。
私たちのアプローチを検証するために、実際のレストランに関するクラウドソーシングの質問と会話で構成されるデータセットを導入します。
データセット内の質問の 51% 以上で構造化データと非構造化データの両方が必要であり、これが一般的な現象であることを示唆しています。
SUQL に基づく少数ショット会話エージェントは、すべてのユーザー要件を満たすエンティティを 89.3% の確率で検出するのに対し、強力で一般的に使用されるベースラインの場合はわずか 65.0% であることを示しています。

要約(オリジナル)

Many knowledge sources consist of both structured information such as relational databases as well as unstructured free text. Building a conversational interface to such data sources is challenging. This paper introduces SUQL, Structured and Unstructured Query Language, the first formal executable representation that naturally covers compositions of structured and unstructured data queries. Specifically, it augments SQL with several free-text primitives to form a precise, succinct, and expressive representation. This paper also presents a conversational search agent based on large language models, including a few-shot contextual semantic parser for SUQL. To validate our approach, we introduce a dataset consisting of crowdsourced questions and conversations about real restaurants. Over 51% of the questions in the dataset require both structured and unstructured data, suggesting that it is a common phenomenon. We show that our few-shot conversational agent based on SUQL finds an entity satisfying all user requirements 89.3% of the time, compared to just 65.0% for a strong and commonly used baseline.

arxiv情報

著者 Shicheng Liu,Jialiang Xu,Wesley Tjangnaka,Sina J. Semnani,Chen Jie Yu,Gui Dávid,Monica S. Lam
発行日 2023-11-16 11:48:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.PL パーマリンク