Explainable Identification of Hate Speech towards Islam using Graph Neural Networks


オンライン プラットフォーム上のイスラム嫌悪的な言語は不寛容を助長し、調和を促進するために検出と排除が重要になります。
従来のヘイトスピーチ検出モデルは、トークン化、品詞タグ付け、エンコーダー/デコーダー モデルなどの NLP 技術に依存しています。
ただし、グラフ ニューラル ネットワーク (GNN) は、データ ポイント間の関係を利用する機能により、より効果的な検出と優れた説明可能性を提供します。
この研究では、GNN を使用してイスラム教に対するヘイトスピーチを特定し説明する新しいパラダイムを紹介します。
私たちのモデルは、GNN を活用して、事前トレーニング済みの NLP で生成された単語埋め込みを介してテキストを接続することでヘイトスピーチのコンテキストとパターンを理解し、価値ある説明を提供しながら最先端のパフォーマンスを達成し、検出精度を向上させます。
これは、オンラインのヘイトスピーチと闘い、より安全でより包括的なオンライン環境を促進する上での GNN の可能性を浮き彫りにしています。


Islamophobic language on online platforms fosters intolerance, making detection and elimination crucial for promoting harmony. Traditional hate speech detection models rely on NLP techniques like tokenization, part-of-speech tagging, and encoder-decoder models. However, Graph Neural Networks (GNNs), with their ability to utilize relationships between data points, offer more effective detection and greater explainability. In this work, we represent speeches as nodes and connect them with edges based on their context and similarity to develop the graph. This study introduces a novel paradigm using GNNs to identify and explain hate speech towards Islam. Our model leverages GNNs to understand the context and patterns of hate speech by connecting texts via pretrained NLP-generated word embeddings, achieving state-of-the-art performance and enhancing detection accuracy while providing valuable explanations. This highlights the potential of GNNs in combating online hate speech and fostering a safer, more inclusive online environment.


著者 Azmine Toushik Wasi
発行日 2024-09-11 14:59:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.IR, cs.LG, cs.SI パーマリンク