Large scale analysis of gender bias and sexism in song lyrics

要約

タイトル:歌詞における性差別とセクシズムの大規模分析

要約:
– 377,808の英語の歌詞を分析し、自然言語処理技術を用いて、性差別の表現に注目し、1960年代から2010年代にかけての5つの年代にわたって、性差の測定を行いました。
– セクシズム分類器を利用して、過去の小規模な手動注釈付き人気歌曲のサンプルを使用する前の研究よりも、より大規模なスケールで性差別の歌詞を特定します。
– さらに、曲の歌詞で学習した言葉の埋め込みを測定することで、性差のバイアスを明らかにします。
– 時間の経過とともに、男性アーティストの特にBillboardチャートに登場する人気曲では、セクシズムの内容が増加することがわかりました。
– 曲には、パフォーマーの性別に応じて異なる言語バイアスが含まれていることも示され、男性ソロアーティストの曲にはより多くの強いバイアスが含まれています。
– これは、文化の影響力の高い部分の言語使用についての洞察を提供する、このタイプの初めての大規模な分析です。

要約(オリジナル)

We employ Natural Language Processing techniques to analyse 377808 English song lyrics from the ‘Two Million Song Database’ corpus, focusing on the expression of sexism across five decades (1960-2010) and the measurement of gender biases. Using a sexism classifier, we identify sexist lyrics at a larger scale than previous studies using small samples of manually annotated popular songs. Furthermore, we reveal gender biases by measuring associations in word embeddings learned on song lyrics. We find sexist content to increase across time, especially from male artists and for popular songs appearing in Billboard charts. Songs are also shown to contain different language biases depending on the gender of the performer, with male solo artist songs containing more and stronger biases. This is the first large scale analysis of this type, giving insights into language usage in such an influential part of popular culture.

arxiv情報

著者 Lorenzo Betti,Carlo Abrate,Andreas Kaltenbrunner
発行日 2023-04-02 21:13:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL, cs.CY パーマリンク