要約
共感的な反応を生成するための現在のアプローチは、通常、対話履歴全体を直接エンコードし、出力をデコーダーに入れて友好的なフィードバックを生成します。
これらの方法は、文脈情報をモデル化することに焦点を当てていますが、話者の直接的な意図を捉えることを怠っています。
対話の最後の発話は、経験的に話者の意図を伝えると主張します。
その結果、共感的反応生成のための InferEM という名前の新しいモデルを提案します。
最後の発話を個別にエンコードし、多頭注意ベースの意図融合モジュールを介して対話全体と融合し、話者の意図を捉えます。
また、過去の発話から最後の発話を予測することで、人間の心理をシミュレートし、対話者が何を話しているかを事前に推測します。
発話予測と応答生成の最適化率のバランスをとるために、マルチタスク学習戦略が InferEM 用に設計されています。
実験結果は、共感表現の改善における InferEM の妥当性と妥当性を示しています。
要約(オリジナル)
Current approaches to empathetic response generation typically encode the entire dialogue history directly and put the output into a decoder to generate friendly feedback. These methods focus on modelling contextual information but neglect capturing the direct intention of the speaker. We argue that the last utterance in the dialogue empirically conveys the intention of the speaker. Consequently, we propose a novel model named InferEM for empathetic response generation. We separately encode the last utterance and fuse it with the entire dialogue through the multi-head attention based intention fusion module to capture the speaker’s intention. Besides, we utilize previous utterances to predict the last utterance, which simulates human’s psychology to guess what the interlocutor may speak in advance. To balance the optimizing rates of the utterance prediction and response generation, a multi-task learning strategy is designed for InferEM. Experimental results demonstrate the plausibility and validity of InferEM in improving empathetic expression.
arxiv情報
著者 | Guoqing Lv,Jiang Li,Xiaoping Wang |
発行日 | 2023-03-28 03:55:11+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google