EmoTwiCS: A Corpus for Modelling Emotion Trajectories in Dutch Customer Service Dialogues on Twitter


ユーザー生成コンテンツの台頭により、顧客サービスを提供するチャネルとしてソーシャル メディアがますます採用されています。
これらのオンライン プラットフォームの公共的な性格を考慮すると、感情の自動検出は、顧客満足度を監視し、否定的な口コミを防ぐ上で重要なアプリケーションとなります。
この論文では、感情の軌跡の注釈が付けられた、Twitter 上のオランダの顧客サービス 9,489 件の対話のコーパスである EmoTwiCS を紹介します。
したがって、「感情の軌跡」という用語は、顧客が経験するきめ細かい感情 (28 のラベルと価性-覚醒-優勢スコアで注釈が付けられている) だけを指すのではなく、会話の前に起こった出来事や人間によって行われた反応も指します。
演算子 (両方とも 8 カテゴリの注釈が付いています)。
結果として得られたデータセットのアノテーター間合意 (IAA) スコアは相当なもので、関連研究と同等であり、その高品質を裏付けています。
注釈付き情報のさまざまな層間の相互作用を考慮して、(i) 個別のツイートに含まれる静的な感情、(ii) 動的な感情とその軌道の変化、(iii) 原因と反応の役割を調査するために、いくつかの詳細な分析を実行します。
最後に、データセットの利点と限界を列挙し、その後、EmoTwiCS を適用できるさまざまな種類の予測モデリング タスクと未解決の研究課題についていくつかの提案を示します。


Due to the rise of user-generated content, social media is increasingly adopted as a channel to deliver customer service. Given the public character of these online platforms, the automatic detection of emotions forms an important application in monitoring customer satisfaction and preventing negative word-of-mouth. This paper introduces EmoTwiCS, a corpus of 9,489 Dutch customer service dialogues on Twitter that are annotated for emotion trajectories. In our business-oriented corpus, we view emotions as dynamic attributes of the customer that can change at each utterance of the conversation. The term `emotion trajectory’ refers therefore not only to the fine-grained emotions experienced by customers (annotated with 28 labels and valence-arousal-dominance scores), but also to the event happening prior to the conversation and the responses made by the human operator (both annotated with 8 categories). Inter-annotator agreement (IAA) scores on the resulting dataset are substantial and comparable with related research, underscoring its high quality. Given the interplay between the different layers of annotated information, we perform several in-depth analyses to investigate (i) static emotions in isolated tweets, (ii) dynamic emotions and their shifts in trajectory, and (iii) the role of causes and response strategies in emotion trajectories. We conclude by listing the advantages and limitations of our dataset, after which we give some suggestions on the different types of predictive modelling tasks and open research questions to which EmoTwiCS can be applied. The dataset is available upon request and will be made publicly available upon acceptance of the paper.


著者 Sofie Labat,Thomas Demeester,Véronique Hoste
発行日 2023-10-10 11:31:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク