Improving Cross-Domain Hate Speech Generalizability with Emotion Knowledge

要約

信頼性の高い自動ヘイトスピーチ (HS) 検出システムは、ヘイトスピーチを抑制するために、流入する多様な新しいデータに適応する必要があります。
ただし、ヘイト スピーチ検出システムは一般に、トレーニングで使用されたデータと異なるヘイト スピーチを識別する汎用性が欠けており、現実世界の展開における堅牢性が妨げられます。
この研究では、マルチタスク アーキテクチャで感情の知識を活用して、クロスドメイン設定でのヘイト スピーチ検出の一般化可能性を向上させる、ヘイト スピーチの一般化フレームワークを提案します。
私たちはさまざまな感情カテゴリスコープで感情コーパスを調査し、一般化されたヘイトスピーチ検出を促進するために感情知識を提供するための最適なコーパススコープを決定します。
さらに、ヘイトスピーチに適応した事前トレーニング済みのトランスフォーマー モデルの使用と、感情豊かなヘイトスピーチ一般化モデルに対するその効果との関係を評価します。
私たちは、さまざまなオンライン ドメインから取得した 6 つの公的に利用可能なデータセットに対して広範な実験を実行し、感情を強化した HS 検出汎化手法がクロスドメイン評価における一貫した汎化の向上を示し、汎化パフォーマンスが最大 18.1%、平均クロスドメイン パフォーマンスが最大 18.1% 向上することを示しました。
F1 の測定によると 8.5%。

要約(オリジナル)

Reliable automatic hate speech (HS) detection systems must adapt to the in-flow of diverse new data to curtail hate speech. However, hate speech detection systems commonly lack generalizability in identifying hate speech dissimilar to data used in training, impeding their robustness in real-world deployments. In this work, we propose a hate speech generalization framework that leverages emotion knowledge in a multitask architecture to improve the generalizability of hate speech detection in a cross-domain setting. We investigate emotion corpora with varying emotion categorical scopes to determine the best corpus scope for supplying emotion knowledge to foster generalized hate speech detection. We further assess the relationship between using pretrained Transformers models adapted for hate speech and its effect on our emotion-enriched hate speech generalization model. We perform extensive experiments on six publicly available datasets sourced from different online domains and show that our emotion-enriched HS detection generalization method demonstrates consistent generalization improvement in cross-domain evaluation, increasing generalization performance up to 18.1% and average cross-domain performance up to 8.5%, according to the F1 measure.

arxiv情報

著者 Shi Yin Hong,Susan Gauch
発行日 2023-12-17 23:14:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク