Hate Speech Detection in Limited Data Contexts using Synthetic Data Generation

要約

オンラインに投稿されるヘイトスピーチの増加を検出するためのテキスト分類方法に焦点を当てた研究が増えています。
この進歩は、選択された数の高度なリソースの言語に限定されているため、検出システムのパフォーマンスが低下するか、限られたデータ コンテキストでは存在しません。
これは主に、これらの設定での収集と管理に費用がかかるトレーニング データの不足が原因です。
この研究では、合成データ生成技術を使用して、限られたデータコンテキストでオンラインヘイトスピーチ検出のためのデータ不足の問題に対処するデータ拡張アプローチを提案します。
英語などの高リソース言語での少数のヘイトスピーチの例を考慮して、元の例のヘイト感情を保持しながらヘイトターゲットを移す、ターゲット言語でのヘイトスピーチデータの新しい例を合成する 3 つの方法を紹介します。
私たちのアプローチを適用して、ヒンディー語とベトナム語でのヘイトスピーチ分類タスクのトレーニング データを生成します。
私たちの調査結果は、合成データでトレーニングされたモデルは、ターゲット ドメインで利用可能なサンプルのみでトレーニングされたモデルと同等のパフォーマンスを発揮し、場合によってはそれを上回るパフォーマンスを発揮することを示しています。
この方法は、限られたデータ コンテキストでヘイト スピーチ検出モデルを最初からブートストラップするために採用できます。
こうした状況におけるソーシャルメディアの成長が対応努力を上回り続けているため、この取り組みはヘイトスピーチの検出、理解、対応の能力をさらに高めています。

要約(オリジナル)

A growing body of work has focused on text classification methods for detecting the increasing amount of hate speech posted online. This progress has been limited to only a select number of highly-resourced languages causing detection systems to either under-perform or not exist in limited data contexts. This is majorly caused by a lack of training data which is expensive to collect and curate in these settings. In this work, we propose a data augmentation approach that addresses the problem of lack of data for online hate speech detection in limited data contexts using synthetic data generation techniques. Given a handful of hate speech examples in a high-resource language such as English, we present three methods to synthesize new examples of hate speech data in a target language that retains the hate sentiment in the original examples but transfers the hate targets. We apply our approach to generate training data for hate speech classification tasks in Hindi and Vietnamese. Our findings show that a model trained on synthetic data performs comparably to, and in some cases outperforms, a model trained only on the samples available in the target domain. This method can be adopted to bootstrap hate speech detection models from scratch in limited data contexts. As the growth of social media within these contexts continues to outstrip response efforts, this work furthers our capacities for detection, understanding, and response to hate speech.

arxiv情報

著者 Aman Khullar,Daniel Nkemelu,Cuong V. Nguyen,Michael L. Best
発行日 2023-10-04 15:10:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.CY パーマリンク