SalesBot 2.0: A Human-Like Intent-Guided Chit-Chat Dataset

要約

対話システムとコーパスに関する最近の研究では、タスク指向 (TOD) 対話とオープンドメイン (おしゃべり) 対話という 2 つの異なるカテゴリに重点が置かれています。
TOD システムは、見たい映画を見つけるなど、特定のユーザーの目標を満たすことを目的としていますが、オープンドメイン システムは主に魅力的な会話を生み出すことに重点を置いています。
Chiuらによる最近の研究。
(2022) は、おしゃべりからタスク指向の対話に 1 ターンで移行できるシミュレーターとデータセットを提供する SalesBot を導入しました。
ただし、以前に生成されたデータは BlenderBot のみに依存していたため、会話中の長回しの自然さと一貫性について懸念が生じました。
この問題に対処するために、このホワイト ペーパーでは、適切なプロンプトを通じて大規模言語モデル (LLM) の常識的な知識を活用して、公開データの改訂版である SalesBot 2.0 を構築することを目的としています。
目的は、雑談と TOD の間のギャップを徐々に埋めて、より自然さと一貫性を高めることです。
新しくリリースされた詳細な注釈付きの大規模データセットは、トピック間の移行がよりスムーズで、自然さと一貫性の点でより人間に近いものになっています。
これは、学術研究と商用アプリケーションの両方にとって貴重なリソースとして役立ちます。
さらに、私たちが提案するフレームワークは、さまざまなターゲットの意図を持つ多数の対話を生成するために適用できます。

要約(オリジナル)

In recent research on dialogue systems and corpora, there has been a significant focus on two distinct categories: task-oriented (TOD) and open-domain (chit-chat) dialogues. TOD systems aim to satisfy specific user goals, such as finding a movie to watch, whereas open-domain systems primarily focus on generating engaging conversations. A recent study by Chiu et al. (2022) introduced SalesBot, which provides simulators and a dataset with one-turn transition from chit-chat to task-oriented dialogues. However, the previously generated data solely relied on BlenderBot, which raised concerns about its long-turn naturalness and consistency during a conversation. To address this issue, this paper aims to build SalesBot 2.0, a revised version of the published data, by leveraging the commonsense knowledge of large language models (LLMs) through proper prompting. The objective is to gradually bridge the gap between chit-chat and TOD towards better naturalness and consistency. The newly released large-scale dataset with detailed annotations exhibits smoother transitions between topics and is more human-like in terms of naturalness and consistency. It can serve as a valuable resource for both academic research and commercial applications. Furthermore, our proposed framework can be applied to generate numerous dialogues with various target intents.

arxiv情報

著者 Wen-Yu Chang,Yun-Nung Chen
発行日 2023-08-28 02:48:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク