ReflectDiffu: Reflect between Emotion-intent Contagion and Mimicry for Empathetic Response Generation via a RL-Diffusion Framework

要約

共感的な反応を生成するには、意味のある相互作用を促進するために感情的および意図的なダイナミクスを統合する必要があります。
既存の研究では、感情と意図の間の複雑な相互作用が無視され、共感の制御性が最適ではなくなるか、大きな計算オーバーヘッドを引き起こす大規模言語モデル (LLM) に頼っています。
このペーパーでは、共感的な応答を生成するための軽量で包括的なフレームワークである ReflectDiffu を紹介します。
このフレームワークには、感情の表現力を高めるために感情伝染が組み込まれており、重要な感情要素を正確に特定するために感情推論マスクが採用されています。
さらに、強化学習内に意図の模倣を統合して、拡散時の改良を実現します。
ReflectDiffu は、探索、サンプリング、修正のメカニズムを 2 回反映するインテントを利用することで、感情的な意思決定を正確なインテントのアクションに巧みに変換し、それによって感情的な誤認識から生じる共感的な反応のずれに対処します。
このフレームワークは、内省を通じて感情状態を意図にマッピングし、反応の共感と柔軟性の両方を著しく強化します。
包括的な実験により、ReflectDiffu は関連性、制御性、情報提供性に関して既存のモデルを上回っており、自動評価と人間による評価の両方で最先端の結果を達成していることが明らかになりました。

要約(オリジナル)

Empathetic response generation necessitates the integration of emotional and intentional dynamics to foster meaningful interactions. Existing research either neglects the intricate interplay between emotion and intent, leading to suboptimal controllability of empathy, or resorts to large language models (LLMs), which incur significant computational overhead. In this paper, we introduce ReflectDiffu, a lightweight and comprehensive framework for empathetic response generation. This framework incorporates emotion contagion to augment emotional expressiveness and employs an emotion-reasoning mask to pinpoint critical emotional elements. Additionally, it integrates intent mimicry within reinforcement learning for refinement during diffusion. By harnessing an intent twice reflect the mechanism of Exploring-Sampling-Correcting, ReflectDiffu adeptly translates emotional decision-making into precise intent actions, thereby addressing empathetic response misalignments stemming from emotional misrecognition. Through reflection, the framework maps emotional states to intents, markedly enhancing both response empathy and flexibility. Comprehensive experiments reveal that ReflectDiffu outperforms existing models regarding relevance, controllability, and informativeness, achieving state-of-the-art results in both automatic and human evaluations.

arxiv情報

著者 Jiahao Yuan,Zixiang Di,Zhiqing Cui,Guisong Yang,Usman Naseem
発行日 2024-09-16 13:56:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.LG パーマリンク