要約
このホワイトペーパーでは、Akan Conversation Emotion(ACE)データセットを紹介します。これは、アフリカの言語の最初のマルチモーダル感情対話データセットであり、感情認識研究における低リソース言語のリソースの重大な欠如に対処します。
アカン語用に開発されたエースには、音声、視覚、テキストのモダリティ全体に385の感情標識対話と6,162の発話が含まれており、単語レベルの韻律顕著な注釈が含まれています。
このデータセットに韻律ラベルが存在することは、それを最初の韻律的に注釈したアフリカの言語データセットにもなります。
最先端の感情認識方法を使用して、実験を通じてACEの品質と有用性を実証し、将来の研究のための確固たるベースラインを確立します。
ACEが、包括的、言語的、文化的に多様なNLPリソースに関するさらなる作業を促すことを願っています。
要約(オリジナル)
In this paper, we introduce the Akan Conversation Emotion (ACE) dataset, the first multimodal emotion dialogue dataset for an African language, addressing the significant lack of resources for low-resource languages in emotion recognition research. ACE, developed for the Akan language, contains 385 emotion-labeled dialogues and 6,162 utterances across audio, visual, and textual modalities, along with word-level prosodic prominence annotations. The presence of prosodic labels in this dataset also makes it the first prosodically annotated African language dataset. We demonstrate the quality and utility of ACE through experiments using state-of-the-art emotion recognition methods, establishing solid baselines for future research. We hope ACE inspires further work on inclusive, linguistically and culturally diverse NLP resources.
arxiv情報
著者 | David Sasu,Zehui Wu,Ziwei Gong,Run Chen,Pengyuan Shi,Lin Ai,Julia Hirschberg,Natalie Schluter |
発行日 | 2025-02-26 16:48:07+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google