NatCS: Eliciting Natural Customer Support Dialogues

要約

【タイトル】NatCS:自然なお客様サポートの対話を引き出す

【要約】
– 自然なカスタマーサポートの会話に基づくアプリケーションに対する関心が高まっているにもかかわらず、このような環境下での会話の期待される特性を反映する公開データセットは驚くほど少数しか存在していない。
– 既存のタスク指向の対話データセットには、主に人とボットの書き込みベースの設定で対話システムをベンチマーク化するために収集されたものがあり、現実のカスタマーサポートの会話を表しておらず、自然なデータに適用されるシステムにとって現実的なベンチマークを提供していない。
– このギャップを埋めるために、私たちは、複数のドメインにわたる話し言葉によるカスタマーサービスの対話の合成的な収集のプロセスを説明しながら、NatCSを紹介する。私たちは、実際の会話で観察される自然言語現象に基づいて、顧客とエージェントの間の合成的な会話を収集するプロセスを説明する。
– 私たちのアプローチで収集された会話は、過去の対話データセットに比べて、複数の指標で実際の人間同士の会話により近い。
– 最後に、NatCSの潜在的な用途を示し、対話行為分類や対話からの意図誘導などの可能性があり、NatCSの対話行為注釈が既存の合成的な書き込みデータセットに比べ、実際の会話をモデル化する効果的なトレーニングデータを提供することを示す。私たちは、自然発話のシステムの研究を促進するために、NatCSを公開する。

要約(オリジナル)

Despite growing interest in applications based on natural customer support conversations, there exist remarkably few publicly available datasets that reflect the expected characteristics of conversations in these settings. Existing task-oriented dialogue datasets, which were collected to benchmark dialogue systems mainly in written human-to-bot settings, are not representative of real customer support conversations and do not provide realistic benchmarks for systems that are applied to natural data. To address this gap, we introduce NatCS, a multi-domain collection of spoken customer service conversations. We describe our process for collecting synthetic conversations between customers and agents based on natural language phenomena observed in real conversations. Compared to previous dialogue datasets, the conversations collected with our approach are more representative of real human-to-human conversations along multiple metrics. Finally, we demonstrate potential uses of NatCS, including dialogue act classification and intent induction from conversations as potential applications, showing that dialogue act annotations in NatCS provide more effective training data for modeling real conversations compared to existing synthetic written datasets. We publicly release NatCS to facilitate research in natural dialog systems

arxiv情報

著者 James Gung,Emily Moeng,Wesley Rose,Arshit Gupta,Yi Zhang,Saab Mansour
発行日 2023-05-04 17:25:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL パーマリンク