STATE ToxiCN: A Benchmark for Span-level Target-Aware Toxicity Extraction in Chinese Hate Speech Detection

要約

ヘイトスピーチの急増は、社会に大きな害をもたらしました。
憎しみの強度と方向性は、それが関連付けられているターゲットと議論に密接に結びついています。
ただし、中国語でのヘイトスピーチ検出に関する研究は遅れをとっており、既存のデータセットにはスパンレベルのファイングレインアノテーションがありません。
さらに、中国の憎悪の俗語に関する研究の欠如は、重要な課題をもたらします。
この論文では、中国のヘイトスピーチを細かく検出するためのソリューションを提供します。
まず、最初のスパンレベルの中国のヘイトスピーチデータセットであるターゲットアングメント – 嫌いなグループQuadruples(状態毒性)を含むデータセットを構築します。
第二に、状態毒性を使用して既存モデルのスパンレベルのヘイトスピーチ検出パフォーマンスを評価します。
最後に、中国の憎悪の俗語に関する最初の研究を実施し、LLMSがそのような表現を検出する能力を評価します。
私たちの仕事は、中国語でのスパンレベルのヘイトスピーチ検出を促進するための貴重なリソースと洞察を提供しています。

要約(オリジナル)

The proliferation of hate speech has caused significant harm to society. The intensity and directionality of hate are closely tied to the target and argument it is associated with. However, research on hate speech detection in Chinese has lagged behind, and existing datasets lack span-level fine-grained annotations. Furthermore, the lack of research on Chinese hateful slang poses a significant challenge. In this paper, we provide a solution for fine-grained detection of Chinese hate speech. First, we construct a dataset containing Target-Argument-Hateful-Group quadruples (STATE ToxiCN), which is the first span-level Chinese hate speech dataset. Secondly, we evaluate the span-level hate speech detection performance of existing models using STATE ToxiCN. Finally, we conduct the first study on Chinese hateful slang and evaluate the ability of LLMs to detect such expressions. Our work contributes valuable resources and insights to advance span-level hate speech detection in Chinese.

arxiv情報

著者 Zewen Bai,Yuanyuan Sun,Shengdi Yin,Junyu Lu,Jingjie Zeng,Haohao Zhu,Liang Yang,Hongfei Lin
発行日 2025-02-14 14:03:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク