要約
この研究では、ヘイトスピーチを 5 つの異なる言説カテゴリに分類する新しい注釈スキームを提案します。
私たちのスキームを評価するために、ユダヤ人に向けられた憎悪表現を含む 290 万件を超える Twitter 投稿のコーパスを構築し、1,050 件のツイートのサンプル データセットに注釈を付けます。
注釈付きデータセットの統計分析を提示し、注釈の例について説明し、将来の研究の有望な方向性について議論して締めくくります。
要約(オリジナル)
In this work we propose a novel annotation scheme which factors hate speech into five separate discursive categories. To evaluate our scheme, we construct a corpus of over 2.9M Twitter posts containing hateful expressions directed at Jews, and annotate a sample dataset of 1,050 tweets. We present a statistical analysis of the annotated dataset as well as discuss annotation examples, and conclude by discussing promising directions for future work.
arxiv情報
著者 | Gal Ron,Effi Levi,Odelia Oshri,Shaul R. Shenhav |
発行日 | 2023-11-07 13:08:55+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google