minOffense: Inter-Agreement Hate Terms for Stable Rules, Concepts, Transitivities, and Lattices

要約

ソーシャルメディアプラットフォーム上でのヘイトスピーチの蔓延により、ヘイトスピーチの分類が重要な問題となっています。
特定のヘイト用語リスト (HT リスト) とヘイト スピーチ データ (HS データ) のセットについて、どのヘイト 用語がヘイト スピーチの分類に最も貢献しているかを理解するのは困難です。
この論文は、共起するヘイト用語 (HT) 間の関係を定量的に測定し、定性的に視覚化するための 2 つのアプローチに貢献します。
まず、既存の HT リストから深刻なヘイト用語リスト (Severe HT リスト) を作成することにより、ヘイトスピーチを分類するアプローチを提案します。
私たちの目標を達成するために、HT の重症度を測定するための 3 つの指標 (憎しみ、相対性、攻撃性) を提案しました。
これらの指標は、ヘイトスピーチの分類に対する個々のヘイト用語の寄与を説明する相互合意 HT リストの作成に役立ちます。
次に、提案された最小攻撃しきい値 (minOffense) を超える HT の攻撃性メトリック値を使用して、新しい重大な HT リストを生成しました。
私たちのアプローチを評価するために、3 つのヘイトスピーチ データセットと 6 つのヘイト用語リストを使用しました。
私たちのアプローチでは、ベースラインと比較して、0.845 から 0.923 (最良) への改善が示されました。
次に、最小の安定性 (minStab) でさまざまな HT の順序付けられた同時発生を提供する Stable Hate Rule (SHR) マイニングも提案しました。
SHR マイニングは、頻繁に同時発生する HT を検出して、安定したヘイト ルールとコンセプトを形成します。
これらのルールと概念は、HT によって形成される推移性と格子のグラフを視覚化するために使用されます。

要約(オリジナル)

Hate speech classification has become an important problem due to the spread of hate speech on social media platforms. For a given set of Hate Terms lists (HTs-lists) and Hate Speech data (HS-data), it is challenging to understand which hate term contributes the most for hate speech classification. This paper contributes two approaches to quantitatively measure and qualitatively visualise the relationship between co-occurring Hate Terms (HTs). Firstly, we propose an approach for the classification of hate-speech by producing a Severe Hate Terms list (Severe HTs-list) from existing HTs-lists. To achieve our goal, we proposed three metrics (Hatefulness, Relativeness, and Offensiveness) to measure the severity of HTs. These metrics assist to create an Inter-agreement HTs-list, which explains the contribution of an individual hate term toward hate speech classification. Then, we used the Offensiveness metric values of HTs above a proposed threshold minimum Offense (minOffense) to generate a new Severe HTs-list. To evaluate our approach, we used three hate speech datasets and six hate terms lists. Our approach shown an improvement from 0.845 to 0.923 (best) as compared to the baseline. Secondly, we also proposed Stable Hate Rule (SHR) mining to provide ordered co-occurrence of various HTs with minimum Stability (minStab). The SHR mining detects frequently co-occurring HTs to form Stable Hate Rules and Concepts. These rules and concepts are used to visualise the graphs of Transitivities and Lattices formed by HTs.

arxiv情報

著者 Animesh Chaturvedi,Rajesh Sharma
発行日 2023-05-29 09:47:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.SI, https://www.youtube.com/watch?v=iRGXiJGp3Cc&list=PLtvWi5o3JBnF3yxcjGdT4KCDLxRBIpsyR パーマリンク