要約
ソーシャルメディアユーザーとボットなどの不正なアカウントは、トピックを宣伝する際に調整する場合があります。
このようなトピックは、中央に管理されているアストロターフィングキャンペーンであるにもかかわらず、それらが一般に一般的に人気があるという印象を与えるかもしれません。
信頼できるグラウンドトゥルースがないため、トピックがオーガニックなキャンペーンであるか調整されたキャンペーンであるかを予測することは困難です。
この論文では、一時的なアストロターフィング攻撃によって促進されたキャンペーンを検出することにより、そのような基本真理を作成します。
これらの攻撃は、短期間で調整された方法でツイートするボットを使用して、すぐにツイートを削除するボットを使用することにより、Twitterの(x)トレンドリストにトピックをプッシュします。
オーガニックのTwitterトレンドのデータセットを手動でキュレートします。
次に、これらのデータセットからエンゲージメントネットワークを作成し、キャンペーンとオーガニックトレンドを区別するためのグラフ分類タスクの挑戦的なテストベッドとして機能します。
エンゲージメントネットワークは、ユーザーがユーザー間でエッジ(リツイート、返信、引用符)としてノードとして、およびエンゲージメントとしてユーザーで構成されています。
179のキャンペーンと135の非キャンペーンのエンゲージメントネットワークをリリースし、キャンペーンと非キャンペーンのタイプを特徴付けるより細かい穀物ラベルも提供します。
データセットであるLEN(大規模なエンゲージメントネットワーク)は、以下のURLで入手できます。
数十のノードとせいぜい数百のエッジがある従来のグラフ分類データセットと比較して、LENのグラフは大きくなっています。
Lenの平均グラフには、〜11kノードと〜23kのエッジがあります。
最先端のGNNメソッドは、レンのキャンペーンと非キャンペーンおよびキャンペーンタイプの分類の平凡な結果のみを与えることを示しています。
レンは、グラフ分類の問題にユニークで挑戦的なプレイフィールドを提供します。
レンは、大規模なネットワーク上のグラフ分類技術のフロンティアを前進させ、調整されたキャンペーンとオーガニックトレンドを区別するという点で興味深いユースケースを提供するのに役立つと考えています。
要約(オリジナル)
Social media users and inauthentic accounts, such as bots, may coordinate in promoting their topics. Such topics may give the impression that they are organically popular among the public, even though they are astroturfing campaigns that are centrally managed. It is challenging to predict if a topic is organic or a coordinated campaign due to the lack of reliable ground truth. In this paper, we create such ground truth by detecting the campaigns promoted by ephemeral astroturfing attacks. These attacks push any topic to Twitter’s (X) trends list by employing bots that tweet in a coordinated manner in a short period and then immediately delete their tweets. We manually curate a dataset of organic Twitter trends. We then create engagement networks out of these datasets which can serve as a challenging testbed for graph classification task to distinguish between campaigns and organic trends. Engagement networks consist of users as nodes and engagements as edges (retweets, replies, and quotes) between users. We release the engagement networks for 179 campaigns and 135 non-campaigns, and also provide finer-grain labels to characterize the type of the campaigns and non-campaigns. Our dataset, LEN (Large Engagement Networks), is available in the URL below. In comparison to traditional graph classification datasets, which are small with tens of nodes and hundreds of edges at most, graphs in LEN are larger. The average graph in LEN has ~11K nodes and ~23K edges. We show that state-of-the-art GNN methods give only mediocre results for campaign vs. non-campaign and campaign type classification on LEN. LEN offers a unique and challenging playfield for the graph classification problem. We believe that LEN will help advance the frontiers of graph classification techniques on large networks and also provide an interesting use case in terms of distinguishing coordinated campaigns and organic trends.
arxiv情報
著者 | Atul Anand Gopalakrishnan,Jakir Hossain,Tugrulcan Elmas,Ahmet Erdem Sariyuce |
発行日 | 2025-03-28 14:54:05+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google