Detecting Social Media Manipulation in Low-Resource Languages

要約

ソーシャル メディアは、政治的操作や偽情報など、悪意のある目的で意図的に使用されてきました。
ほとんどの研究は、高リソース言語に焦点を当てています。
ただし、悪意のあるアクターは、リソースの少ない国や言語を含め、国や言語を超えてコンテンツを共有しています。
ここでは、低リソースの言語設定で悪意のあるアクターを検出できるかどうか、およびどの程度まで検出できるかを調査します。
2016 年の米国大統領選挙後の妨害活動に対する Twitter の取り締まりの一環として、タガログ語で投稿された多数のアカウントが停止されたことがわかりました。
テキスト埋め込みと転移学習を組み合わせることで、私たちのフレームワークは、タガログ語の悪意のあるコンテンツに関する事前の知識やトレーニングがなくても、タガログ語で投稿した悪意のあるユーザーを確実な精度で検出できます。
まず、リソースの多い言語 (英語) とリソースの少ない言語 (タガログ語) の各言語の埋め込みモデルを個別に学習します。
次に、検出モデルを転送するために、2 つの潜在空間間のマッピングを学習します。
提案されたアプローチが、BERT を含む最先端のモデルよりも大幅に優れており、オンライン プラットフォームで悪意のあるアクティビティを検出する際の標準である、トレーニング データが非常に限られている環境で顕著な利点が得られることを示しています。

要約(オリジナル)

Social media have been deliberately used for malicious purposes, including political manipulation and disinformation. Most research focuses on high-resource languages. However, malicious actors share content across countries and languages, including low-resource ones. Here, we investigate whether and to what extent malicious actors can be detected in low-resource language settings. We discovered that a high number of accounts posting in Tagalog were suspended as part of Twitter’s crackdown on interference operations after the 2016 US Presidential election. By combining text embedding and transfer learning, our framework can detect, with promising accuracy, malicious users posting in Tagalog without any prior knowledge or training on malicious content in that language. We first learn an embedding model for each language, namely a high-resource language (English) and a low-resource one (Tagalog), independently. Then, we learn a mapping between the two latent spaces to transfer the detection model. We demonstrate that the proposed approach significantly outperforms state-of-the-art models, including BERT, and yields marked advantages in settings with very limited training data — the norm when dealing with detecting malicious activity in online platforms.

arxiv情報

著者 Samar Haider,Luca Luceri,Ashok Deb,Adam Badawy,Nanyun Peng,Emilio Ferrara
発行日 2023-02-19 07:07:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.SI パーマリンク