Tollywood Emotions: Annotation of Valence-Arousal in Telugu Song Lyrics

要約

特定の音楽トラックからの感情認識は、音響機能、ソーシャル タグ、およびメタデータに大きく依存してきましたが、歌詞に焦点を合わせることはめったにありません。
歌詞の価と覚醒の両方の手動評価を含むインド語の歌のデータセットはありません。
Spotify から収集されたテルグ語の歌の歌詞の手動で注釈が付けられた新しいデータセットを提示し、個別のスケールで注釈が付けられた原子価と覚醒を使用します。
価数と覚醒の両方で、かなり高いアノテーター間合意が観察されました。
その後、2 つの分類手法を使用して 2 つの音楽感情認識モデルを作成し、歌詞から価数、覚醒、およびそれぞれの感情象限を識別します。
用語頻度-逆ドキュメント頻度 (TF-IDF) 機能を備えたサポート ベクター マシン (SVM) と、事前トレーニング済みの XLMRoBERTa (XLM-R) モデルの微調整が、価数、覚醒、象限分類タスクに使用されました。
微調整された XLMRoBERTa は、10 倍クロスで、原子価、覚醒、および象限分類について、それぞれ 54.69%、67.61%、34.13% のマクロ平均 F1 スコアを 77.90%、80.71%、および 58.33% に改善することにより、SVM よりも優れたパフォーマンスを発揮します。
-検証。
さらに、歌詞の注釈を、音楽トラック全体に基づく Spotify の価数とエネルギー (覚醒と同じ) の注釈と比較します。
私たちの調査結果の意味について説明します。
最後に、歌詞、注釈、Spotify ID を含むデータセットを公開します。

要約(オリジナル)

Emotion recognition from a given music track has heavily relied on acoustic features, social tags, and metadata but is seldom focused on lyrics. There are no datasets of Indian language songs that contain both valence and arousal manual ratings of lyrics. We present a new manually annotated dataset of Telugu songs’ lyrics collected from Spotify with valence and arousal annotated on a discrete scale. A fairly high inter-annotator agreement was observed for both valence and arousal. Subsequently, we create two music emotion recognition models by using two classification techniques to identify valence, arousal and respective emotion quadrant from lyrics. Support vector machine (SVM) with term frequency-inverse document frequency (TF-IDF) features and fine-tuning the pre-trained XLMRoBERTa (XLM-R) model were used for valence, arousal and quadrant classification tasks. Fine-tuned XLMRoBERTa performs better than the SVM by improving macro-averaged F1-scores of 54.69%, 67.61%, 34.13% to 77.90%, 80.71% and 58.33% for valence, arousal and quadrant classifications, respectively, on 10-fold cross-validation. In addition, we compare our lyrics annotations with Spotify’s annotations of valence and energy (same as arousal), which are based on entire music tracks. The implications of our findings are discussed. Finally, we make the dataset publicly available with lyrics, annotations and Spotify IDs.

arxiv情報

著者 R Guru Ravi Shanker,B Manikanta Gupta,BV Koushik,Vinoo Alluri
発行日 2023-03-16 14:47:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク