Facilitating Multi-turn Emotional Support Conversation with Positive Emotion Elicitation: A Reinforcement Learning Approach


既存の研究は、根拠のある応答と応答戦略 (質問など) を当てはめることにとどまっており、ES への影響を無視しており、感情的なポジティブな移行を導くための明確な目標が欠けています。
この目的を達成するために、マルチターン ESC をポジティブな感情を引き出すプロセスとして形式化する新しいパラダイムを導入します。
このタスクに対処するには、一貫性などの会話の目標を維持しながら、会話の進行に応じて ES での引き出しの強度を微調整する必要があります。
この論文では、専門家混合ベースの強化学習モデルであるサポーターを提案し、政策の対応学習を導くための ES と対話の一貫性報酬を適切に設計します。


Emotional support conversation (ESC) aims to provide emotional support (ES) to improve one’s mental state. Existing works stay at fitting grounded responses and responding strategies (e.g., question), which ignore the effect on ES and lack explicit goals to guide emotional positive transition. To this end, we introduce a new paradigm to formalize multi-turn ESC as a process of positive emotion elicitation. Addressing this task requires finely adjusting the elicitation intensity in ES as the conversation progresses while maintaining conversational goals like coherence. In this paper, we propose Supporter, a mixture-of-expert-based reinforcement learning model, and well design ES and dialogue coherence rewards to guide policy’s learning for responding. Experiments verify the superiority of Supporter in achieving positive emotion elicitation during responding while maintaining conversational goals including coherence.


著者 Jinfeng Zhou,Zhuang Chen,Bo Wang,Minlie Huang
発行日 2023-07-16 09:58:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク