A Federated Approach to Few-Shot Hate Speech Detection for Marginalized Communities

要約

ヘイトスピーチオンラインは、特にインターネットの浸透が増加する社会の発展を含む、疎外されたコミュニティ、特にグローバルな南部では研究されていない問題のままです。
この論文では、母国語で攻撃的なコンテンツをフィルタリングすることにより、オンラインヘイトスピーチから身を守るためのプライバシー推定ツールを使用して、支配的な言語が低リソースである社会で疎外されたコミュニティを提供することを目指しています。
私たちの貢献は2つあります。1)私たちは、経験豊富なデータコレクターによってキュレーションされた複数のターゲットグループと低リソース言語で構成される高品質で文化固有のヘイトスピーチ検出データセットのコレクションである、リリース(コンテキスト間で応答性のあるヘイトスピーチデータセット)をリリースします。
2)Federated Learning(FL)に基づいたいくつかのショットのヘイトスピーチ検出アプローチを提案します。これは、さまざまなターゲットグループや言語に取り組むときに堅牢性を示す中央モデルを共同でトレーニングするためのプライバシーを提供する方法です。
トレーニングをユーザーデバイスからローカルに保持することにより、FLの集合学習メリットを活用しながら、データプライバシーを確​​保します。
さらに、特定のターゲットグループに合わせたパーソナライズされたクライアントモデルを探索し、パフォーマンスを評価します。
私たちの調査結果は、異なるターゲットグループにわたるFLの全体的な有効性を示しており、パーソナライズを有望な方向として示しています。

要約(オリジナル)

Hate speech online remains an understudied issue for marginalized communities, particularly in the Global South, which includes developing societies with increasing internet penetration. In this paper, we aim to provide marginalized communities in societies where the dominant language is low-resource with a privacy-preserving tool to protect themselves from online hate speech by filtering offensive content in their native languages. Our contributions are twofold: 1) we release REACT (REsponsive hate speech datasets Across ConTexts), a collection of high-quality, culture-specific hate speech detection datasets comprising multiple target groups and low-resource languages, curated by experienced data collectors; 2) we propose a few-shot hate speech detection approach based on federated learning (FL), a privacy-preserving method for collaboratively training a central model that exhibits robustness when tackling different target groups and languages. By keeping training local to user devices, we ensure data privacy while leveraging the collective learning benefits of FL. Furthermore, we explore personalized client models tailored to specific target groups and evaluate their performance. Our findings indicate the overall effectiveness of FL across different target groups, and point to personalization as a promising direction.

arxiv情報

著者 Haotian Ye,Axel Wisiorek,Antonis Maronikolakis,Özge Alaçam,Hinrich Schütze
発行日 2025-04-11 11:34:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク