要約
【タイトル】会話における感情認識のための多言語多党データセットであるM-MELD
【要約】
– 感情表現は、日常的な人間のコミュニケーションにおいて非常に重要な部分である。
– 会話における感情認識は、その主要なタスクが会話の各発言の背後にある感情を識別することである、新興の研究分野である。
– ERCに関するこれまでの多くの研究では、英語にのみ注目しており、他の言語には焦点を当てていない。
– 本研究では、Multimodal EmotionLines Dataset(MELD)をGreek、Polish、French、Spanishを含む4つの言語に拡張することで、Multilingual MELD(M-MELD)を提供する。
– これら4つの言語について、強力なベースラインを確立するだけでなく、DiscLSTMという新しいアーキテクチャを提案し、会話の対話文脈を順序と対話の両方の文脈で使用してERCを行う。
– 提案手法は計算量が少なく、クロスリンガルエンコーダだけを使って言語を超えて転送できるようになっており、文献上の大多数のユニモーダルテキスト手法よりも良い性能をMELDおよびM-MELDの両方で達成している。
– データとコードはGitHub上に公開されている。
要約(オリジナル)
Expression of emotions is a crucial part of daily human communication. Emotion recognition in conversations (ERC) is an emerging field of study, where the primary task is to identify the emotion behind each utterance in a conversation. Though a lot of work has been done on ERC in the past, these works only focus on ERC in the English language, thereby ignoring any other languages. In this paper, we present Multilingual MELD (M-MELD), where we extend the Multimodal EmotionLines Dataset (MELD) \cite{poria2018meld} to 4 other languages beyond English, namely Greek, Polish, French, and Spanish. Beyond just establishing strong baselines for all of these 4 languages, we also propose a novel architecture, DiscLSTM, that uses both sequential and conversational discourse context in a conversational dialogue for ERC. Our proposed approach is computationally efficient, can transfer across languages using just a cross-lingual encoder, and achieves better performance than most uni-modal text approaches in the literature on both MELD and M-MELD. We make our data and code publicly on GitHub.
arxiv情報
著者 | Sreyan Ghosh,S Ramaneswaran,Utkarsh Tyagi,Harshvardhan Srivastava,Samden Lepcha,S Sakshi,Dinesh Manocha |
発行日 | 2023-03-31 13:25:05+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, OpenAI