Searching for Snippets of Open-Domain Dialogue in Task-Oriented Dialogue Datasets

要約

既存の対話コーパスとモデルのほとんどは、2 つの主要なカテゴリに適合するように設計されています。タスク指向の対話は、レストランの予約や航空券の予約などの機能的な目標を描写するのに対し、おしゃべり/オープンドメインの対話は、社会的な会話を行うことに焦点を当てています。
ユーザーとの魅力的な会話。
ただし、人間はモードをシームレスに切り替えたり、タスク指向の会話を強化するために雑談を使用したりする傾向があります。
このギャップを埋めるために、両方の通信モードを会話例に融合した新しいデータセットが最近作成されました。
使用されるアプローチは、人間が生成した既存のタスク指向のデータセットにおしゃべりのスニペットを追加することに依存する傾向があります。
しかし、人間に観察される傾向を考えると、後者は \textit{すでに}おしゃべりのシーケンスを保持していないのではないかと疑問に思います。
トピック モデリングを使用し、ソーシャル トークに関連する一連のキーワードに最も類似するトピックを検索することにより、スキーマに基づく対話と MultiWOZ のトレーニング セットを調査します。
私たちの研究は、社交的な会話に関連するシーケンスが実際に自然に存在することを示しており、おしゃべりをタスク指向の対話に組み合わせる方法についてのさらなる研究の動機となっています。

要約(オリジナル)

Most existing dialogue corpora and models have been designed to fit into 2 predominant categories : task-oriented dialogues portray functional goals, such as making a restaurant reservation or booking a plane ticket, while chit-chat/open-domain dialogues focus on holding a socially engaging talk with a user. However, humans tend to seamlessly switch between modes and even use chitchat to enhance task-oriented conversations. To bridge this gap, new datasets have recently been created, blending both communication modes into conversation examples. The approaches used tend to rely on adding chit-chat snippets to pre-existing, human-generated task-oriented datasets. Given the tendencies observed in humans, we wonder however if the latter do not \textit{already} hold chit-chat sequences. By using topic modeling and searching for topics which are most similar to a set of keywords related to social talk, we explore the training sets of Schema-Guided Dialogues and MultiWOZ. Our study shows that sequences related to social talk are indeed naturally present, motivating further research on ways chitchat is combined into task-oriented dialogues.

arxiv情報

著者 Armand Stricker,Patrick Paroubek
発行日 2023-11-23 16:08:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク