EMNS /Imz/ Corpus: An emotive single-speaker dataset for narrative storytelling in games, television and graphic novels

要約

テキスト読み上げ技術の採用の増加により、会話の文脈や感情的な調子に適応する自然で感情的な音声に対する需要が高まっています。
Emotive Narrative Storytting (EMNS) コーパスは、インタラクティブなナラティブ主導型システムにおける会話の表現力と感情的な品質を向上させるために作成された独自の音声データセットです。
このコーパスは、女性話者がラベル付きの発話を行う 2.3 時間の録音で構成されています。
これには、表現力レベルと単語強調ラベル付きの自然言語説明とともに、0.68% の分散で均等に分散された 8 つの行為された感情状態が含まれています。
さまざまなデータセットからの音声サンプルを評価したところ、感情を正確に伝え、表現力を実証する点で、EMNS コーパスが最高の平均スコアを達成したことが明らかになりました。
共有された感情を伝える点で他のデータセットを上回り、同等レベルの本物性を達成しました。
分類タスクでは、コーパス内の意図された感情が正確に表現されていることが確認され、参加者は録音が本物で表現力豊かなものであると認識しました。
さらに、Apache 2.0 ライセンスに基づいてデータセット収集ツールを利用できるため、研究者はリモートでの音声データの収集が簡素化されます。

要約(オリジナル)

The increasing adoption of text-to-speech technologies has led to a growing demand for natural and emotive voices that adapt to a conversation’s context and emotional tone. The Emotive Narrative Storytelling (EMNS) corpus is a unique speech dataset created to enhance conversations’ expressiveness and emotive quality in interactive narrative-driven systems. The corpus consists of a 2.3-hour recording featuring a female speaker delivering labelled utterances. It encompasses eight acted emotional states, evenly distributed with a variance of 0.68%, along with expressiveness levels and natural language descriptions with word emphasis labels. The evaluation of audio samples from different datasets revealed that the EMNS corpus achieved the highest average scores in accurately conveying emotions and demonstrating expressiveness. It outperformed other datasets in conveying shared emotions and achieved comparable levels of genuineness. A classification task confirmed the accurate representation of intended emotions in the corpus, with participants recognising the recordings as genuine and expressive. Additionally, the availability of the dataset collection tool under the Apache 2.0 License simplifies remote speech data collection for researchers.

arxiv情報

著者 Kari Ali Noriy,Xiaosong Yang,Jian Jun Zhang
発行日 2023-05-25 16:17:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.LG, cs.MM パーマリンク