Detecting Social Media Manipulation in Low-Resource Languages


ソーシャル メディアは、政治的操作や偽情報など、悪意のある目的で意図的に使用されてきました。
2016 年の米国大統領選挙後の妨害活動に対する Twitter の取り締まりの一環として、タガログ語で投稿された多数のアカウントが停止されたことがわかりました。
まず、リソースの多い言語 (英語) とリソースの少ない言語 (タガログ語) の各言語の埋め込みモデルを個別に学習します。
次に、検出モデルを転送するために、2 つの潜在空間間のマッピングを学習します。
提案されたアプローチが、BERT を含む最先端のモデルよりも大幅に優れており、オンライン プラットフォームで悪意のあるアクティビティを検出する際の標準である、トレーニング データが非常に限られている環境で顕著な利点が得られることを示しています。


Social media have been deliberately used for malicious purposes, including political manipulation and disinformation. Most research focuses on high-resource languages. However, malicious actors share content across countries and languages, including low-resource ones. Here, we investigate whether and to what extent malicious actors can be detected in low-resource language settings. We discovered that a high number of accounts posting in Tagalog were suspended as part of Twitter’s crackdown on interference operations after the 2016 US Presidential election. By combining text embedding and transfer learning, our framework can detect, with promising accuracy, malicious users posting in Tagalog without any prior knowledge or training on malicious content in that language. We first learn an embedding model for each language, namely a high-resource language (English) and a low-resource one (Tagalog), independently. Then, we learn a mapping between the two latent spaces to transfer the detection model. We demonstrate that the proposed approach significantly outperforms state-of-the-art models, including BERT, and yields marked advantages in settings with very limited training data — the norm when dealing with detecting malicious activity in online platforms.


著者 Samar Haider,Luca Luceri,Ashok Deb,Adam Badawy,Nanyun Peng,Emilio Ferrara
発行日 2023-02-19 07:07:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.CL, cs.SI パーマリンク