Injecting Salesperson’s Dialogue Strategies in Large Language Models with Chain-of-Thought Reasoning

要約

対話システムとコーパスに関する最近の研究は、タスク指向 (TOD) 対話とオープンドメイン (おしゃべり) 対話という 2 つの主要なカテゴリに焦点を当てています。
TOD システムはユーザーが特定のタスクを達成するのに役立ちますが、オープンドメイン システムは魅力的な会話を生み出すことを目的としています。
ただし、現実のシナリオでは、ユーザーの意図は対話中に明らかになることがよくあります。
最近の研究では、営業担当者をトレーニングするために、おしゃべりからタスク指向のシナリオに移行する対話をシミュレートする SalesBot が導入されました。
残念ながら、初期データにはスムーズな移行や一貫した長期対話が欠けており、その結果、販売と顧客のやり取りの自然さが不十分になりました。
これらの問題に対処するために、このホワイト ペーパーでは、改良されたデータセットである SalesBot 2.0 を紹介します。
戦略的なプロンプトを通じて大規模言語モデル (LLM) からの常識的な知識を活用します。
さらに、思考連鎖 (CoT) 推論を使用して、営業担当者の対話でトレーニングされた SalesAgent と呼ばれる新しいモデルを導入します。
このモデルは、トピックの移行、ユーザーの意図の理解、適切な戦略の選択に優れています。
多様なユーザーシミュレーションを使用した実験により、LLM での対話戦略を制御する際の私たちの方法の有効性が検証されます。
さらに、SalesBot 2.0 は一貫性を強化し、攻撃性を軽減し、販売と顧客の対話のためのより優れたモデル学習を促進します。

要約(オリジナル)

Recent research in dialogue systems and corpora has focused on two main categories: task-oriented (TOD) and open-domain (chit-chat) dialogues. TOD systems help users accomplish specific tasks, while open-domain systems aim to create engaging conversations. However, in real-world scenarios, user intents are often revealed during interactions. A recent study introduced SalesBot, which simulates dialogues transitioning from chit-chat to task-oriented scenarios to train sales agents. Unfortunately, the initial data lacked smooth transitions and coherent long-turn dialogues, resulting in poor naturalness in sales-customer interactions. To address these issues, this paper presents SalesBot 2.0, an improved dataset. It leverages commonsense knowledge from large language models (LLMs) through strategic prompting. Additionally, we introduce a novel model called SalesAgent, trained on salesperson’s interactions, using chain-of-thought (CoT) reasoning. This model excels in transitioning topics, understanding user intents, and selecting appropriate strategies. Experiments using diverse user simulations validate the effectiveness of our method in controlling dialogue strategies in LLMs. Furthermore, SalesBot 2.0 enhances coherence and reduces aggression, facilitating better model learning for sales-customer interactions.

arxiv情報

著者 Wen-Yu Chang,Yun-Nung Chen
発行日 2024-04-29 10:12:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク