Effectiveness of Counter-Speech against Abusive Content: A Multidimensional Annotation and Classification Study

要約

カウンタースピーチ(CS)は、オンラインヘイトスピーチ(HS)を緩和するための重要な戦略ですが、その有効性を評価するための基準を定義することは未解決の課題です。
社会科学の概念に基づいたCS有効性分類のための新しい計算フレームワークを提案します。
私たちのフレームワークでは、2つのベンチマークデータセットから4,214 CSインスタンスに注釈を付け、コミュニティにリリースされた新しい言語リソースをもたらすために使用するために使用するために使用するために使用するために使用するために使用するために使用する6つのコアディメンションの6つのコアディメンションを定義します。
さらに、マルチタスクと依存関係ベースの2つの分類戦略を提案し、強力な結果(それぞれ専門家およびユーザー作成の両方のCSで平均F1が0.94と0.96のF1)、標準ベースラインを上回り、次元間の強い相互依存性を明らかにします。

要約(オリジナル)

Counter-speech (CS) is a key strategy for mitigating online Hate Speech (HS), yet defining the criteria to assess its effectiveness remains an open challenge. We propose a novel computational framework for CS effectiveness classification, grounded in social science concepts. Our framework defines six core dimensions – Clarity, Evidence, Emotional Appeal, Rebuttal, Audience Adaptation, and Fairness – which we use to annotate 4,214 CS instances from two benchmark datasets, resulting in a novel linguistic resource released to the community. In addition, we propose two classification strategies, multi-task and dependency-based, achieving strong results (0.94 and 0.96 average F1 respectively on both expert- and user-written CS), outperforming standard baselines, and revealing strong interdependence among dimensions.

arxiv情報

著者 Greta Damo,Elena Cabrio,Serena Villata
発行日 2025-06-13 16:11:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク