Analyzing User Characteristics of Hate Speech Spreaders on Social Media

要約

ソーシャルメディア上のヘイトスピーチは、個人の精神的および肉体的な健康を脅かし、現実世界の暴力の一因となります。
再共有は、ソーシャルメディア上でヘイトスピーチが広がる重要な要因です。
しかし、誰がヘイトスピーチを再共有するのか、またその特徴は何なのかについてはほとんど知られていない。
この論文では、さまざまな種類のヘイト スピーチ (政治的ヘイトなど) にわたるヘイト スピーチの再共有におけるユーザー特性の役割を分析します。
このために、次のように進めます。 まず、大規模な言語モデルを使用してヘイト スピーチ投稿をクラスタリングし、さまざまな種類のヘイト スピーチを識別します。
次に、説明可能な機械学習モデルを使用して、ユーザーがヘイトスピーチを再共有する確率に対するユーザー属性の影響をモデル化します。
そのために、バイアス除去を適用してソーシャルメディアの観察データの選択バイアスを制御し、ヘイトスピーチに対するユーザーの潜在的な脆弱性をさらに制御します。
他のすべてが同じ場合、フォロワー、友達、投稿が少なく、アカウントが古いユーザーほど、ヘイトスピーチを共有することが多いことがわかりました。
これは、社会的影響力がほとんどないユーザーがより多くのヘイトスピーチを共有する傾向があることを示しています。
さらに、さまざまなタイプのヘイトスピーチにわたって実質的な不均一性が見られます。
たとえば、人種差別的および女性蔑視的な憎悪は、主に社会的影響力がほとんどないユーザーによって拡散されます。
対照的に、政治的な反トランプや反右翼への憎しみは、より大きな社会的影響力を持つユーザーによって再共有されます。
全体として、ユーザーをヘイトスピーチの共有に駆り立てる要因を理解することは、有害な行為に関与するリスクのある個人を検出し、効果的な緩和戦略を設計するために重要です。

要約(オリジナル)

Hate speech on social media threatens the mental and physical well-being of individuals and contributes to real-world violence. Resharing is an important driver behind the spread of hate speech on social media. Yet, little is known about who reshares hate speech and what their characteristics are. In this paper, we analyze the role of user characteristics in hate speech resharing across different types of hate speech (e.g., political hate). For this, we proceed as follows: First, we cluster hate speech posts using large language models to identify different types of hate speech. Then we model the effects of user attributes on users’ probability to reshare hate speech using an explainable machine learning model. To do so, we apply debiasing to control for selection bias in our observational social media data and further control for the latent vulnerability of users to hate speech. We find that, all else equal, users with fewer followers, fewer friends, fewer posts, and older accounts share more hate speech. This shows that users with little social influence tend to share more hate speech. Further, we find substantial heterogeneity across different types of hate speech. For example, racist and misogynistic hate is spread mostly by users with little social influence. In contrast, political anti-Trump and anti-right-wing hate is reshared by users with larger social influence. Overall, understanding the factors that drive users to share hate speech is crucial for detecting individuals at risk of engaging in harmful behavior and for designing effective mitigation strategies.

arxiv情報

著者 Dominique Geissler,Abdurahman Maarouf,Stefan Feuerriegel
発行日 2024-07-29 14:40:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CY, cs.SI パーマリンク