Hostility Detection in UK Politics: A Dataset on Online Abuse Targeting MPs

要約

多くの政治家がソーシャル メディア プラットフォーム、特に X を利用して有権者と交流しています。
このやりとりにより、有権者は質問をしたりフィードバックを提供したりできるようになりますが、特にソーシャルメディアによって匿名性が得られることを考えると、政治家は敵対的な反応の集中砲火にさらされることになります。
彼らは通常、政府の役割に関連して標的にされますが、コメントは個人のアイデンティティを攻撃する傾向もあります。
これにより、政治家の信用が失墜し、政府に対する国民の信頼が低下する可能性があります。
また、怒りや無礼を煽り、オフラインでの危害や暴力につながる可能性もあります。
一般に敵意を検出するためのモデルは多数存在しますが、それらは政治的状況に必要な特異性を欠いています。
さらに、政治家に対する敵意に対処するには、それぞれの国に固有の言語や問題(例:英国の EU 離脱)が異なるため、個別のアプローチが必要になります。
このギャップを埋めるために、英国国会議員に対する敵意について手動で注釈を付けた、2 年間にわたる 3,320 件の英語ツイートのデータセットを構築しました。
私たちのデータセットは、敵対的なツイートに含まれるターゲットとなるアイデンティティの特徴 (人種、性別、宗教、なし) もキャプチャします。
私たちは言語分析と話題分析を実行して、英国の政治データのユニークな内容を掘り下げます。
最後に、バイナリ敵意検出およびマルチクラスを対象としたアイデンティティ タイプ分類タスクにおける、事前トレーニング済み言語モデルと大規模言語モデルのパフォーマンスを評価します。
私たちの研究は、英国特有の政治関連の敵意の蔓延と性質に関する将来の研究に貴重なデータと洞察を提供します。

要約(オリジナル)

Numerous politicians use social media platforms, particularly X, to engage with their constituents. This interaction allows constituents to pose questions and offer feedback but also exposes politicians to a barrage of hostile responses, especially given the anonymity afforded by social media. They are typically targeted in relation to their governmental role, but the comments also tend to attack their personal identity. This can discredit politicians and reduce public trust in the government. It can also incite anger and disrespect, leading to offline harm and violence. While numerous models exist for detecting hostility in general, they lack the specificity required for political contexts. Furthermore, addressing hostility towards politicians demands tailored approaches due to the distinct language and issues inherent to each country (e.g., Brexit for the UK). To bridge this gap, we construct a dataset of 3,320 English tweets spanning a two-year period manually annotated for hostility towards UK MPs. Our dataset also captures the targeted identity characteristics (race, gender, religion, none) in hostile tweets. We perform linguistic and topical analyses to delve into the unique content of the UK political data. Finally, we evaluate the performance of pre-trained language models and large language models on binary hostility detection and multi-class targeted identity type classification tasks. Our study offers valuable data and insights for future research on the prevalence and nature of politics-related hostility specific to the UK.

arxiv情報

著者 Mugdha Pandya,Mali Jin,Kalina Bontcheva,Diana Maynard
発行日 2024-12-05 10:37:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク