Factoring Hate Speech: A New Annotation Framework to Study Hate Speech in Social Media

要約

この研究では、ヘイトスピーチを 5 つの異なる言説カテゴリに分類する新しい注釈スキームを提案します。
私たちのスキームを評価するために、ユダヤ人に向けられた憎悪表現を含む 290 万件を超える Twitter 投稿のコーパスを構築し、1,050 件のツイートのサンプル データセットに注釈を付けます。
注釈付きデータセットの統計分析を提示し、注釈の例について説明し、将来の研究の有望な方向性について議論して締めくくります。

要約(オリジナル)

In this work we propose a novel annotation scheme which factors hate speech into five separate discursive categories. To evaluate our scheme, we construct a corpus of over 2.9M Twitter posts containing hateful expressions directed at Jews, and annotate a sample dataset of 1,050 tweets. We present a statistical analysis of the annotated dataset as well as discuss annotation examples, and conclude by discussing promising directions for future work.

arxiv情報

著者 Gal Ron,Effi Levi,Odelia Oshri,Shaul R. Shenhav
発行日 2023-11-07 13:08:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク