Towards a comprehensive taxonomy of online abusive language informed by machine leaning

要約

オンラインコミュニケーションにおける虐待的な言語の急増は、個人やコミュニティの健康と幸福に重大なリスクをもたらしました。
オンラインの虐待とその結果に関する懸念の高まりには、有害なコンテンツを特定して緩和し、継続的な監視、緩和、および早期介入を促進する方法が必要です。
このペーパーでは、オンラインテキスト内で虐待的な言語の重要な特性を区別するための分類法を提示します。
私たちのアプローチでは、分類法の開発に体系的な方法を使用して、18の既存のマルチラベルデータセットの分類システムを統合して、オンラインの虐待的な言語分類に関連する重要な特性をキャプチャします。
結果の分類法は階層的でファセットされ、5つのカテゴリと17の寸法で構成されています。
コンテキスト、目標、強度、直接性、虐待のテーマなど、オンライン虐待のさまざまな側面を分類します。
この共有された理解は、よりまとまりのある努力につながり、知識交換を促進し、研究者、政策立案者、オンラインプラットフォーム所有者、およびその他の利害関係者の間のオンライン虐待の検出と緩和の分野での進歩を加速させることができます。

要約(オリジナル)

The proliferation of abusive language in online communications has posed significant risks to the health and wellbeing of individuals and communities. The growing concern regarding online abuse and its consequences necessitates methods for identifying and mitigating harmful content and facilitating continuous monitoring, moderation, and early intervention. This paper presents a taxonomy for distinguishing key characteristics of abusive language within online text. Our approach uses a systematic method for taxonomy development, integrating classification systems of 18 existing multi-label datasets to capture key characteristics relevant to online abusive language classification. The resulting taxonomy is hierarchical and faceted, comprising 5 categories and 17 dimensions. It classifies various facets of online abuse, including context, target, intensity, directness, and theme of abuse. This shared understanding can lead to more cohesive efforts, facilitate knowledge exchange, and accelerate progress in the field of online abuse detection and mitigation among researchers, policy makers, online platform owners, and other stakeholders.

arxiv情報

著者 Samaneh Hosseini Moghaddam,Kelly Lyons,Cheryl Regehr,Vivek Goel,Kaitlyn Regehr
発行日 2025-04-24 15:23:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク