要約
会話型製品検索(CPS)は、人間のような言語を反映する実際のCPSデータセットがないため、シミュレートされた会話に限定されます。
さらに、現在の会話データセットは、クロスマーケットおよび多言語使用をサポートするために制限されています。
このペーパーでは、新しいCPSデータ収集プロトコルとPresent PSCONを紹介します。PSCONは、人間のような会話を介して製品検索を支援するために設計された新しいCPSデータセットです。
データセットは、コーチされた人間から人間へのデータ収集プロトコルを使用して構築され、2つの言語とデュアル市場をサポートしています。
また、データセットにより、ユーザー意図の検出、キーワード抽出、システムアクション予測、質問選択、アイテムのランキング、応答生成の6つのCPSのサブタスクの徹底的な調査が可能になります。
さらに、データセットの分析も提供し、提案されたCPSデータセットのベンチマークモデルを提案します。
要約(オリジナル)
Conversational Product Search (CPS) is confined to simulated conversations due to the lack of real-world CPS datasets that reflect human-like language. Additionally, current conversational datasets are limited to support cross-market and multi-lingual usage. In this paper, we introduce a new CPS data collection protocol and present PSCon, a novel CPS dataset designed to assist product search via human-like conversations. The dataset is constructed using a coached human-to-human data collection protocol and supports two languages and dual markets. Also, the dataset enables thorough exploration of six subtasks of CPS: user intent detection, keyword extraction, system action prediction, question selection, item ranking, and response generation. Furthermore, we also offer an analysis of the dataset and propose a benchmark model on the proposed CPS dataset.
arxiv情報
著者 | Jie Zou,Mohammad Aliannejadi,Evangelos Kanoulas,Shuxi Han,Heli Ma,Zheng Wang,Yang Yang,Heng Tao Shen |
発行日 | 2025-02-19 17:05:42+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google