The Role of Network and Identity in the Diffusion of Hashtags

要約

行動の広がりは多くの社会的要因によって影響を受けますが、既存の文献では、最終的なカスケードに対する単一の要因 (ほとんどの場合、ソーシャル ネットワークの特性) の影響を研究する傾向があります。
カスケードのより統合的な見方に移行するために、この論文は、Twitter 上での新しい文化の生産を表す 1,337 の人気のあるハッシュタグの普及における 2 つの社会的要因の役割についての最初の包括的な調査を提供します。 1) Twitter ソーシャルのトポロジー
ネットワーク、2) 各ユーザーの推定される人口統計上のアイデンティティのパフォーマンス。
ここでは、ネットワークとアイデンティティのどちらかの要素を単独で使用するのではなく、これらを組み合わせて使用​​することでカスケードを最適にモデル化できることを示します。
この結合モデルは、1,337 個のハッシュタグすべてにわたる 10 個のカスケード プロパティの複合インデックスを最もよく再現します。
しかし、ハッシュタグカスケードのさまざまな特性を再現するためにどのような社会的要因が必要になるかについては、重要な異質性が存在します。
たとえば、ネットワークとアイデンティティを組み合わせたモデルはカスケードの人気を最もよく予測しますが、カスケードの成長の予測ではネットワークのみのモデルの方が優れたパフォーマンスを発揮し、アダプター構成ではアイデンティティのみのモデルの方が優れています。
機能の各組み合わせによってどのタイプのハッシュタグが最適にモデル化されるかを予測し、これを使用してパフォーマンスをさらに向上させることができます。
さらに、ネットワークとアイデンティティの組み合わせモデルに関する先行文献と一致して、人種や地域のアイデンティティ、スタンスのとり方、スポーツについての話、または非常に遅いまたは速い既存の文化的傾向の変形を表現するために使用されるハッシュタグの中で、単一要素の反事実よりも最も優れたパフォーマンスを発揮します。
・コミュニケーションの必要性が高まる。
要約すると、私たちの結果は、ネットワーク、アイデンティティ、その他の社会的要因が Twitter でのハッシュタグの拡散にどのような役割を果たすかを説明するために、カスケードを予測する際の多要素モデルの有用性を示唆しています。

要約(オリジナル)

Although the spread of behaviors is influenced by many social factors, existing literature tends to study the effects of single factors — most often, properties of the social network — on the final cascade. In order to move towards a more integrated view of cascades, this paper offers the first comprehensive investigation into the role of two social factors in the diffusion of 1,337 popular hashtags representing the production of novel culture on Twitter: 1) the topology of the Twitter social network and 2) performance of each user’s probable demographic identity. Here, we show that cascades are best modeled using a combination of network and identity, rather than either factor alone. This combined model best reproduces a composite index of ten cascade properties across all 1,337 hashtags. However, there is important heterogeneity in what social factors are required to reproduce different properties of hashtag cascades. For instance, while a combined network+identity model best predicts the popularity of cascades, a network-only model has better performance in predicting cascade growth and an identity-only model in adopter composition. We are able to predict what type of hashtag is best modeled by each combination of features and use this to further improve performance. Additionally, consistent with prior literature on the combined network+identity model most outperforms the single-factor counterfactuals among hashtags used for expressing racial or regional identity, stance-taking, talking about sports, or variants of existing cultural trends with very slow- or fast-growing communicative need. In sum, our results imply the utility of multi-factor models in predicting cascades, in order to account for the varied ways in which network, identity, and other social factors play a role in the diffusion of hashtags on Twitter.

arxiv情報

著者 Aparna Ananthasubramaniam,Yufei Zhu,David Jurgens,Daniel Romero
発行日 2024-07-17 17:51:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.CY, cs.SI パーマリンク