InferEM: Inferring the Speaker’s Intention for Empathetic Dialogue Generation

要約

タイトル:Empathetic Dialogue Generationのためのスピーカーの意図推定InferEM

要約:
– Empathetic Response Generationの現在のアプローチは、通常ダイアログ履歴を直接エンコードし、出力をデコーダーに置いてフレンドリーなフィードバックを生成するものである。これらの方法は、コンテキスト情報のモデリングに重点を置いているが、スピーカーの直接的な意図を捉えることを無視している。
– 私たちは、ダイアログの最後の発話がスピーカーの意図を経験的に伝えていると主張する。したがって、私たちはEmpathetic Response Generationのための新しいモデルであるInferEMを提案する。
– InferEMでは、最後の発話を別々にエンコードし、マルチヘッドアテンションベースの意図融合モジュールを介してダイアログ全体と融合させてスピーカーの意図を捉えます。
– さらに、前の発話を利用して最後の発話を予測し、相手がどのように話すかを推測する人間の心理をシミュレーションします。
– 発話の予測と応答生成の最適化率をバランスさせるために、InferEMにはマルチタスク学習戦略が設計されています。
– 実験結果は、InferEMが共感的な表現力の向上に有効であることを示しています。

要約(オリジナル)

Current approaches to empathetic response generation typically encode the entire dialogue history directly and put the output into a decoder to generate friendly feedback. These methods focus on modelling contextual information but neglect capturing the direct intention of the speaker. We argue that the last utterance in the dialogue empirically conveys the intention of the speaker. Consequently, we propose a novel model named InferEM for empathetic response generation. We separately encode the last utterance and fuse it with the entire dialogue through the multi-head attention based intention fusion module to capture the speaker’s intention. Besides, we utilize previous utterances to predict the last utterance, which simulates human’s psychology to guess what the interlocutor may speak in advance. To balance the optimizing rates of the utterance prediction and response generation, a multi-task learning strategy is designed for InferEM. Experimental results demonstrate the plausibility and validity of InferEM in improving empathetic expression.

arxiv情報

著者 Guoqing Lv,Jiang Li,Xiaoping Wang,Zhigang Zeng
発行日 2023-04-25 08:58:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL, cs.HC パーマリンク