要約
ネオファシズムは、アメリカ合衆国(米国)および他の西部社会でも過去10年間に顕著な成長を遂げてきた政治的および社会的イデオロギーです。
それは民主主義とそれが標的とする少数派に重大な危険をもたらし、それはエスカレーションを避けるためにそれに対する積極的な行動を必要とします。
この作品は、政治学の研究者によって監督された米国社会的文脈におけるデジタル談話のための、最初の類のないネオファシストコーディングスキームを提示します。
私たちの仕事は、この現象に対する自然言語加工(NLP)と政治学の間のギャップを橋渡ししています。
さらに、コーディングスキームをテストするために、著名なネオファシストグループ(Iron March and Stormfront.orgのフォーラム)からインターネット上で膨大な量のアクティビティを収集し、ガイドラインが収集されたポストのサブセットに適用されます。
クラウドソーシングを通じて、ネオファシストまたは非ネオファシストとラベル付けされた合計1000の投稿に注釈を付けます。
このラベルの付いたデータセットを使用すると、小さな言語モデル(SLM)と大規模な言語モデル(LLM)の両方を微調整およびテストし、ネオファシストの談話の最初の分類モデルを取得します。
この種のフォーラムでのネオファシストのレトリックの有病率は常に存在しており、将来の研究の良いターゲットになっていることがわかります。
社会的文脈は、NLPの研究を実施する際のネオファシストのスピーチの重要な考慮事項です。
最後に、この種の政治運動に対する仕事は、民主社会の幸福のために迫られ続けなければなりません。
免責事項:この調査では、個人や組織にラベルを付けることなく、他のヘイトスピーチ分析と同様に、テキストのネオファシストコンテンツの検出に焦点を当てています。
要約(オリジナル)
Neo-fascism is a political and societal ideology that has been having remarkable growth in the last decade in the United States of America (USA), as well as in other Western societies. It poses a grave danger to democracy and the minorities it targets, and it requires active actions against it to avoid escalation. This work presents the first-of-its-kind neo-fascist coding scheme for digital discourse in the USA societal context, overseen by political science researchers. Our work bridges the gap between Natural Language Processing (NLP) and political science against this phenomena. Furthermore, to test the coding scheme, we collect a tremendous amount of activity on the internet from notable neo-fascist groups (the forums of Iron March and Stormfront.org), and the guidelines are applied to a subset of the collected posts. Through crowdsourcing, we annotate a total of a thousand posts that are labeled as neo-fascist or non-neo-fascist. With this labeled data set, we fine-tune and test both Small Language Models (SLMs) and Large Language Models (LLMs), obtaining the very first classification models for neo-fascist discourse. We find that the prevalence of neo-fascist rhetoric in this kind of forum is ever-present, making them a good target for future research. The societal context is a key consideration for neo-fascist speech when conducting NLP research. Finally, the work against this kind of political movement must be pressed upon and continued for the well-being of a democratic society. Disclaimer: This study focuses on detecting neo-fascist content in text, similar to other hate speech analyses, without labeling individuals or organizations.
arxiv情報
著者 | Rudy Alexandro Garrido Veliz,Martin Semmann,Chris Biemann,Seid Muhie Yimam |
発行日 | 2025-06-12 15:02:18+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google