Beats of Bias: Analyzing Lyrics with Topic Modeling and Gender Bias Measurements

要約

この論文では、トピックモデリングとバイアス測定技術を使用して、英語の歌詞におけるジェンダーバイアスを分析および決定します。
私たちは BERTopic を利用して、537,553 曲の英語の歌を個別のトピックに分類し、時間の経過に伴う発展をグラフ化します。
私たちの分析では、ロマンスのテーマから歌の中の女性の性的対象化の増加へと、長年にわたって歌の歌詞のテーマが変化していることを示しています。
特に全体的に最大のクラスターで、さまざまなトピックに関して冒とく的で女性蔑視的な歌詞が大量に観察されています。
さらに、トピックやジャンルにわたるジェンダーバイアスを分析するために、単一カテゴリ単語埋め込み関連テスト (SC-WEAT) を使用して、最も人気のあるトピックおよび各ジャンルについてトレーニングされた単語埋め込みのバイアス スコアを計算します。
知性や強さに関連する言葉は、より女性に偏った外見や弱さの言葉とは対照的に、ジャンル全体で男性の偏見を示す傾向があることがわかりました。
ただし、詳しく見てみると、トピックごとのバイアスの違いも明らかになります。

要約(オリジナル)

This paper uses topic modeling and bias measurement techniques to analyze and determine gender bias in English song lyrics. We utilize BERTopic to cluster 537,553 English songs into distinct topics and chart their development over time. Our analysis shows the thematic shift in song lyrics over the years, from themes of romance to the increasing sexualization of women in songs. We observe large amounts of profanity and misogynistic lyrics on various topics, especially in the overall biggest cluster. Furthermore, to analyze gender bias across topics and genres, we employ the Single Category Word Embedding Association Test (SC-WEAT) to compute bias scores for the word embeddings trained on the most popular topics as well as for each genre. We find that words related to intelligence and strength tend to show a male bias across genres, as opposed to appearance and weakness words, which are more female-biased; however, a closer look also reveals differences in biases across topics.

arxiv情報

著者 Danqing Chen,Adithi Satish,Rasul Khanbayov,Carolin M. Schuster,Georg Groh
発行日 2024-09-24 10:24:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク