Detecting harassment and defamation in cyberbullying with emotion-adaptive training

要約

ソーシャルメディアでのネットいじめの事件の検出に関する既存の研究は、主に嫌がらせに集中しており、通常、バイナリ分類タスクとしてアプローチされています。
ただし、ネットいじめは、有名人が頻繁に直面する中傷や嫌がらせなど、さまざまな形を網羅しています。
さらに、これらの多様なネットいじめのこれらの多様な形態の適切なトレーニングデータは依然として不足しています。
この研究では、最初に、嫌がらせと名誉am損の2つの異なるタイプのインシデントを含む有名人のサイバーいじめデータセットを開発します。
さまざまなタイプの変圧器ベースのモデル、すなわちマスク(ロベルタ、バート、ディスティルバート)、交換(エレクトラ)、オートレグレッシング(XLNET)、マスク&順列(MPNET)、テキストテキスト(T5)、大規模な言語モデル(LLAMA2およびLLAMA3)を調査します。
低ソース設定の下。
明示的な嫌がらせバイナリ検出で競争力のあるパフォーマンスを発揮することがわかります。
ただし、嫌がらせと中傷の多分類タスクでは、そのパフォーマンスが大幅に低くなっています。
したがって、感情に適応するトレーニングフレームワーク(EAT)を提案します。これは、感情検出の領域からサイバーいじめ検出のドメインに知識を移転して、間接的なサイバーいじめイベントを検出するのに役立ちます。
EATは、低リソース設定の下で9つの変圧器ベースのモデルにわたってサイバーいじめ検出タスクで、平均マクロF1、精度とリコールを20%改善します。
私たちの主張は、直感的な理論的洞察と広範な実験によって裏付けられています。

要約(オリジナル)

Existing research on detecting cyberbullying incidents on social media has primarily concentrated on harassment and is typically approached as a binary classification task. However, cyberbullying encompasses various forms, such as denigration and harassment, which celebrities frequently face. Furthermore, suitable training data for these diverse forms of cyberbullying remains scarce. In this study, we first develop a celebrity cyberbullying dataset that encompasses two distinct types of incidents: harassment and defamation. We investigate various types of transformer-based models, namely masked (RoBERTa, Bert and DistilBert), replacing(Electra), autoregressive (XLnet), masked&permuted (Mpnet), text-text (T5) and large language models (Llama2 and Llama3) under low source settings. We find that they perform competitively on explicit harassment binary detection. However, their performance is substantially lower on harassment and denigration multi-classification tasks. Therefore, we propose an emotion-adaptive training framework (EAT) that helps transfer knowledge from the domain of emotion detection to the domain of cyberbullying detection to help detect indirect cyberbullying events. EAT consistently improves the average macro F1, precision and recall by 20% in cyberbullying detection tasks across nine transformer-based models under low-resource settings. Our claims are supported by intuitive theoretical insights and extensive experiments.

arxiv情報

著者 Peiling Yi,Arkaitz Zubiaga,Yunfei Long
発行日 2025-01-28 13:15:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク