A survey of textual cyber abuse detection using cutting-edge language models and large language models

要約

ソーシャルメディアプラットフォームの成功により、デジタルコミュニティ内でのさまざまな形のオンライン虐待の出現が促進されました。
この虐待は、ヘイトスピーチ、ネットいじめ、精神的虐待、グルーミング、セクスティングなど、さまざまな形で現れます。
このペーパーでは、言語モデル (LM) や大規模言語モデル (LLM) などの新興テクノロジーが検出と攻撃の両方をどのように再構築しているかに特に焦点を当て、ソーシャル メディアで蔓延しているさまざまな形の不正行為の包括的な分析を紹介します。
これらのネットワーク内での不正なコンテンツの生成。
私たちはソーシャルメディアの虐待が永続するメカニズムを掘り下げ、心理的および社会的影響を調査します。
さらに、高度な言語モデルの 2 つの役割を検証し、有害なコンテンツを生成する能力も認識しながら、不正行為の自動検出システムを強化する可能性を強調します。
この文書は、オンラインの安全性と倫理に関する現在進行中の議論に貢献することを目的としており、進化するサイバー虐待の状況と、それを軽減および悪化させる技術革新についての洞察を提供します。

要約(オリジナル)

The success of social media platforms has facilitated the emergence of various forms of online abuse within digital communities. This abuse manifests in multiple ways, including hate speech, cyberbullying, emotional abuse, grooming, and sexting. In this paper, we present a comprehensive analysis of the different forms of abuse prevalent in social media, with a particular focus on how emerging technologies, such as Language Models (LMs) and Large Language Models (LLMs), are reshaping both the detection and generation of abusive content within these networks. We delve into the mechanisms through which social media abuse is perpetuated, exploring the psychological and social impact. Additionally, we examine the dual role of advanced language models-highlighting their potential to enhance automated detection systems for abusive behavior while also acknowledging their capacity to generate harmful content. This paper aims to contribute to the ongoing discourse on online safety and ethics, offering insights into the evolving landscape of cyberabuse and the technological innovations that both mitigate and exacerbate it.

arxiv情報

著者 Jose A. Diaz-Garcia,Joao Paulo Carvalho
発行日 2025-01-09 18:55:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク