What Drives Online Popularity: Author, Content or Sharers? Estimating Spread Dynamics with Bayesian Mixture Hawkes

要約

ソーシャル メディアでのコンテンツの拡散は、ソース、コンテンツ自体、コンテンツの拡散経路という 3 つのレベルで要因が絡み合うことによって形成されます。
最も低いレベルでは、共有ユーザーの人気が最終的な到達範囲を決定します。
ただし、オンライン アイテムの性質やそのソースの信頼性などのより高いレベルの要素も、オンライン アイテムがどれだけ広範囲かつ迅速に拡散するかを決定する上で重要な役割を果たします。
この研究では、ソース、コンテンツ、拡散の影響を共同で学習するためのベイズ混合ホークス (BMH) モデルを提案します。
我々は、BMH モデルを、ホークス ダイナミクスのさまざまなクラスとこれらのクラスに対する特徴セットの影響を考慮した、分離可能なホークス プロセスの階層的混合モデルとして定式化します。
物議を醸すメディア発行者と従来のメディア発行者からの記事を参照する 2 つの現実世界のリツイート カスケード データセットに適用して、コールドスタート人気度予測と時間的プロファイル一般化パフォーマンスという 2 つの学習タスクで BMH モデルをテストします。
BMH モデルは、両方のデータセットで最先端のモデルと予測ベースラインを上回り、代替モデルよりもカスケード レベルおよびアイテム レベルの情報をより適切に利用します。
最後に、トレーニングされた出版社レベルの BMH モデルを一連の記事見出しに適用する反事実分析を実行し、見出しの書き方 (中立的、クリックベイト、扇動的) の有効性が出版社によって異なることを示します。
BMH モデルは、物議を醸しているパブリッシャーと評判の高いパブリッシャーの間のスタイルの有効性の違いを明らかにしており、物議を醸しているパブリッシャーとは対照的に、評判の良いパブリッシャーに対してクリックベイトが著しく効果的であることがわかり、これが後者のクリックベイトの過剰使用に関係しています。

要約(オリジナル)

The spread of content on social media is shaped by intertwining factors on three levels: the source, the content itself, and the pathways of content spread. At the lowest level, the popularity of the sharing user determines its eventual reach. However, higher-level factors such as the nature of the online item and the credibility of its source also play crucial roles in determining how widely and rapidly the online item spreads. In this work, we propose the Bayesian Mixture Hawkes (BMH) model to jointly learn the influence of source, content and spread. We formulate the BMH model as a hierarchical mixture model of separable Hawkes processes, accommodating different classes of Hawkes dynamics and the influence of feature sets on these classes. We test the BMH model on two learning tasks, cold-start popularity prediction and temporal profile generalization performance, applying to two real-world retweet cascade datasets referencing articles from controversial and traditional media publishers. The BMH model outperforms the state-of-the-art models and predictive baselines on both datasets and utilizes cascade- and item-level information better than the alternatives. Lastly, we perform a counter-factual analysis where we apply the trained publisher-level BMH models to a set of article headlines and show that effectiveness of headline writing style (neutral, clickbait, inflammatory) varies across publishers. The BMH model unveils differences in style effectiveness between controversial and reputable publishers, where we find clickbait to be notably more effective for reputable publishers as opposed to controversial ones, which links to the latter’s overuse of clickbait.

arxiv情報

著者 Pio Calderon,Marian-Andrei Rizoiu
発行日 2024-06-12 15:52:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.SI パーマリンク