The Anatomy of Conspirators: Unveiling Traits using a Comprehensive Twitter Dataset

要約

陰謀論をめぐる言説は現在、オンライン環境で蔓延する誤った情報の中で盛んになっています。
この分野の研究は、限られたデータセットに依存することが多く、ソーシャルメディア上の陰謀論を検出することに重点が置かれてきました。
この研究では、2022 年を通じて陰謀関連の活動に関与したアカウントを網羅する Twitter データセットを構築するための新しい方法論を紹介します。私たちのアプローチは、特定の陰謀論や情報操作から独立したデータ収集に重点を置いています。
さらに、私たちのデータセットには、陰謀活動に関与した個人と公平に比較​​できる、ランダムに選択されたユーザーで構成される対照グループが含まれています。
この包括的な収集作業により、合計 15,000 のアカウントとそのタイムラインから抽出された 3,700 万のツイートが得られました。
私たちは、トピック、プロフィール、行動特性という 3 つの側面にわたって 2 つのグループの比較分析を実行します。
結果は、コンスピラシー ユーザーとコントロール ユーザーがプロファイル メタデータ特性の点で類似性を示していることを示しています。
ただし、特に議論されるトピック、使用される用語、トレンドの主題に対するスタンスに関しては、行動や活動の点で大きく異なります。
興味深いことに、2 つのグループ間でボット ユーザーの存在に大きな差はなく、陰謀と自動化が直交する概念であることを示唆しています。
最後に、93 個の特徴を使用して陰謀ユーザーを識別する分類器を開発します。そのうちのいくつかは、トロル識別のための文献で一般的に使用されています。
結果は高い精度レベル (平均 F1 スコアは 0.98%) を示しており、陰謀関連のアカウントに関連する最も差別的な特徴を明らかにすることができます。

要約(オリジナル)

The discourse around conspiracy theories is currently thriving amidst the rampant misinformation prevalent in online environments. Research in this field has been focused on detecting conspiracy theories on social media, often relying on limited datasets. In this study, we present a novel methodology for constructing a Twitter dataset that encompasses accounts engaged in conspiracy-related activities throughout the year 2022. Our approach centers on data collection that is independent of specific conspiracy theories and information operations. Additionally, our dataset includes a control group comprising randomly selected users who can be fairly compared to the individuals involved in conspiracy activities. This comprehensive collection effort yielded a total of 15K accounts and 37M tweets extracted from their timelines. We conduct a comparative analysis of the two groups across three dimensions: topics, profiles, and behavioral characteristics. The results indicate that conspiracy and control users exhibit similarity in terms of their profile metadata characteristics. However, they diverge significantly in terms of behavior and activity, particularly regarding the discussed topics, the terminology used, and their stance on trending subjects. Interestingly, there is no significant disparity in the presence of bot users between the two groups, suggesting that conspiracy and automation are orthogonal concepts. Finally, we develop a classifier to identify conspiracy users using 93 features, some of which are commonly employed in literature for troll identification. The results demonstrate a high accuracy level (with an average F1 score of 0.98%), enabling us to uncover the most discriminative features associated with conspiracy-related accounts.

arxiv情報

著者 Margherita Gambini,Serena Tardelli,Maurizio Tesconi
発行日 2023-08-29 09:35:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.SI パーマリンク