A Group-Specific Approach to NLP for Hate Speech Detection

要約

タイトル:Hate Speech検出のためのグループ特有のNLPアプローチ

要約:

– Hate speechの自動検出は、常に進化する常識、保護されたグループのステレオタイプ、差別に関する歴史の知識を必要とする重要な作業である。
– 本論文では、オンラインヘイトスピーチの検出のためのグループ特有のNLPアプローチを提案している。
– このアプローチは、ある特定の保護されたグループについての歴史的及び言語的知識を作成し、ヘイトスピーチがグループに対して発生することをより正確に予測するために、グループに対する差別に関する過去のデータを分析し、交差する立場と倫理的側面からヘイトスピーチ検出モデルを批判的に評価することから構成される。
– 本アプローチは、反ユダヤ主義ヘイトスピーチのNLPについてのケーススタディによって実証されている。
– ケーススタディでは、反ユダヤ主義検出のためのNLPに関する現在の英語文献を合成し、20世紀から現在までの反ユダヤ主義に関する知識グラフ、Logistic Regressionおよびuncased DistilBERTのベースラインに対するツイートのセットから知識グラフからの情報を注入し、知識グラフからのコンテキストを取り入れることで、モデルが微妙なステレオタイプを認識しやすくなることを示唆している。

要約(オリジナル)

Automatic hate speech detection is an important yet complex task, requiring knowledge of common sense, stereotypes of protected groups, and histories of discrimination, each of which may constantly evolve. In this paper, we propose a group-specific approach to NLP for online hate speech detection. The approach consists of creating and infusing historical and linguistic knowledge about a particular protected group into hate speech detection models, analyzing historical data about discrimination against a protected group to better predict spikes in hate speech against that group, and critically evaluating hate speech detection models through lenses of intersectionality and ethics. We demonstrate this approach through a case study on NLP for detection of antisemitic hate speech. The case study synthesizes the current English-language literature on NLP for antisemitism detection, introduces a novel knowledge graph of antisemitic history and language from the 20th century to the present, infuses information from the knowledge graph into a set of tweets over Logistic Regression and uncased DistilBERT baselines, and suggests that incorporating context from the knowledge graph can help models pick up subtle stereotypes.

arxiv情報

著者 Karina Halevy
発行日 2023-04-21 19:08:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL パーマリンク