要約
ソーシャルメディアにおけるヘイトスピーチは増加しつつある現象であり、このような有害なコンテンツを検出することは、最近、研究コミュニティで大きな注目を集めています。既存の研究では、ヘイトスピーチ検出を行うために言語モデル(LM)を微調整することが検討されており、これらのソリューションは大きな成果を上げています。しかし、これらの研究のほとんどは、英語でのみヘイトスピーチを検出することに限定されており、他の言語、特に低リソース言語で生成される憎悪的なコンテンツの大部分は無視されています。限られたデータで低リソース言語のヘイトスピーチとニュアンスを捉える分類器を開発することは、非常に困難です。この研究ギャップを埋めるために、我々は、低リソース言語におけるヘイトスピーチ検出を効果的に行う、モデルにとらわれないメタ学習ベースのフレームワークであるHateMAMLを提案します。HateMAMLは、データ不足の制限を克服するために自己監視戦略を利用し、未知のターゲット言語(すなわち、クロスリンガル転送)や他のヘイトスピーチデータセット(すなわち、ドメイン一般化)に迅速に適応するためのより良いLM初期化を作成する。8つの異なる低リソース言語にわたる5つのデータセットで広範な実験を行った。その結果、HateMAMLは、クロスドメイン多言語転送の設定において、最先端のベースラインを3%以上上回る性能を持つことがわかった。また、HateMAMLの特性を分析するためにアブレーション研究を実施した。
要約(オリジナル)
Hate speech in social media is a growing phenomenon, and detecting such toxic content has recently gained significant traction in the research community. Existing studies have explored fine-tuning language models (LMs) to perform hate speech detection, and these solutions have yielded significant performance. However, most of these studies are limited to detecting hate speech only in English, neglecting the bulk of hateful content that is generated in other languages, particularly in low-resource languages. Developing a classifier that captures hate speech and nuances in a low-resource language with limited data is extremely challenging. To fill the research gap, we propose HateMAML, a model-agnostic meta-learning-based framework that effectively performs hate speech detection in low-resource languages. HateMAML utilizes a self-supervision strategy to overcome the limitation of data scarcity and produces better LM initialization for fast adaptation to an unseen target language (i.e., cross-lingual transfer) or other hate speech datasets (i.e., domain generalization). Extensive experiments are conducted on five datasets across eight different low-resource languages. The results show that HateMAML outperforms the state-of-the-art baselines by more than 3% in the cross-domain multilingual transfer setting. We also conduct ablation studies to analyze the characteristics of HateMAML.
arxiv情報
著者 | Md Rabiul Awal,Roy Ka-Wei Lee,Eshaan Tanwar,Tanmay Garg,Tanmoy Chakraborty |
発行日 | 2023-03-04 22:28:29+00:00 |
arxivサイト | arxiv_id(pdf) |