BotTriNet: A Unified and Efficient Embedding for Social Bots Detection via Metric Learning

要約

タイトル:BotTriNet:メトリック学習を利用したソーシャルボット検出のための統一かつ効率的なエンベッド

要約:

– オンラインソーシャルネットワークにおける持続的な人気トピックとして、真のユーザーの侵攻と嫌がらせを防ぐため、ボットアカウントの迅速かつ正確な発見があります。
– 文脈はアカウントの人格と習慣を自然に明らかにするため、アカウントが投稿するテキストコンテンツを利用したボット検出のための統一的なエンベッドフレームワーク「BotTriNet」を提案します。
– エンベッド技術を使用することで、システムが効率的にボット関連情報を抽出できる場合、コンテンツは豊富かつ価値があります。
– 単語、文、アカウントのエンベッドを生成する一般的なエンベッドフレームワークに加えて、生のエンベッド(従来の自然言語処理技術によって生成された)を調整するためのトリプレットネットワークを設計します。これにより、より良い分類性能が得られます。
– 私たちはCRESCI2017という実世界のデータセットで、3つのボットアカウントカテゴリと5つのボットサンプルセットの検出精度とf1scoreを評価しました。
– 私たちのシステムは、2つのコンテンツ集中型ボットセットで最高の平均精度98.34%とf1score 97.99%を達成し、以前の作業を上回り、最先端になります。
– また、4つのコンテンツのないボットセットにおいて、平均精度向上率が11.52%、平均f1scoreの増加率が16.70%という画期的な結果を出しました。

要約(オリジナル)

A persistently popular topic in online social networks is the rapid and accurate discovery of bot accounts to prevent their invasion and harassment of genuine users. We propose a unified embedding framework called BotTriNet, which utilizes textual content posted by accounts for bot detection based on the assumption that contexts naturally reveal account personalities and habits. Content is abundant and valuable if the system efficiently extracts bot-related information using embedding techniques. Beyond the general embedding framework that generates word, sentence, and account embeddings, we design a triplet network to tune the raw embeddings (produced by traditional natural language processing techniques) for better classification performance. We evaluate detection accuracy and f1score on a real-world dataset CRESCI2017, comprising three bot account categories and five bot sample sets. Our system achieves the highest average accuracy of 98.34% and f1score of 97.99% on two content-intensive bot sets, outperforming previous work and becoming state-of-the-art. It also makes a breakthrough on four content-less bot sets, with an average accuracy improvement of 11.52% and an average f1score increase of 16.70%.

arxiv情報

著者 Jun Wu,Xuesong Ye,Yanyuet Man
発行日 2023-04-11 04:24:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.SI, I.2 パーマリンク