要約
音声および音声分析の分野では、音響信号から感情を識別する機能が不可欠です。
ヒューマン コンピューター インタラクション (HCI) と行動分析は、音声信号から感情を区別する能力が広範囲に応用できる多くの分野のうちのほんの一部にすぎません。
ここでは、バングラ語専用に作成された音声録音のみからなる感情音声コーパス BanSpEmo を紹介します。
このコーパスには、1 時間 23 分を超える長さにわたる 792 の音声録音が含まれています。
22 人のネイティブ スピーカーが、6 つの望ましい感情を表す 2 組の文の録音に参加しました。
データ セットは、嫌悪感、幸福、悲しみ、驚き、怒り、恐怖の 6 つの感情で発声される 12 のバングラ語の文で構成されています。
このコーパスは性別のバランスも取れていません。
このコーパスの評価には、関連分野の経験または演技経験のある 10 名が参加しました。
各感情クラスにバランスのとれた数の音声録音が含まれています。
BanSpEmo は、バングラ語での感情および音声認識の研究と関連アプリケーションを促進するための有用なリソースと見なされます。
データセットはここで見つけることができます: https://data.mendeley.com/datasets/rdwn4bs5ky で、学術研究に使用される可能性があります。
要約(オリジナル)
In the field of audio and speech analysis, the ability to identify emotions from acoustic signals is essential. Human-computer interaction (HCI) and behavioural analysis are only a few of the many areas where the capacity to distinguish emotions from speech signals has an extensive range of applications. Here, we are introducing BanSpEmo, a corpus of emotional speech that only consists of audio recordings and has been created specifically for the Bangla language. This corpus contains 792 audio recordings over a duration of more than 1 hour and 23 minutes. 22 native speakers took part in the recording of two sets of sentences that represent the six desired emotions. The data set consists of 12 Bangla sentences which are uttered in 6 emotions as Disgust, Happy, Sad, Surprised, Anger, and Fear. This corpus is not also gender balanced. Ten individuals who either have experience in related field or have acting experience took part in the assessment of this corpus. It has a balanced number of audio recordings in each emotion class. BanSpEmo can be considered as a useful resource to promote emotion and speech recognition research and related applications in the Bangla language. The dataset can be found here: https://data.mendeley.com/datasets/rdwn4bs5ky and might be employed for academic research.
arxiv情報
著者 | Md Gulzar Hussain,Mahmuda Rahman,Babe Sultana,Ye Shiren |
発行日 | 2023-12-21 16:52:41+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google