Improving and Evaluating the Detection of Fragmentation in News Recommendations with the Clustering of News Story Chains


この指標を正確に測定するには、自然言語処理 (NLP) を適用して、個別のニュース イベント、ストーリー、またはタイムラインを識別する必要があります。
これらのアプローチは、ニュース記事のクラスタリングのパフォーマンスを測定することによって本質的に評価され、また、シミュレートされたさまざまなニュース レコメンダー シナリオの断片化スコアを評価することによって外部的に評価されます。
私たちの調査結果は、SentenceBERT テキスト表現と組み合わせた凝集型階層クラスタリングが、以前の実装よりも断片化の検出において大幅に優れていることを示しています。


News recommender systems play an increasingly influential role in shaping information access within democratic societies. However, tailoring recommendations to users’ specific interests can result in the divergence of information streams. Fragmented access to information poses challenges to the integrity of the public sphere, thereby influencing democracy and public discourse. The Fragmentation metric quantifies the degree of fragmentation of information streams in news recommendations. Accurate measurement of this metric requires the application of Natural Language Processing (NLP) to identify distinct news events, stories, or timelines. This paper presents an extensive investigation of various approaches for quantifying Fragmentation in news recommendations. These approaches are evaluated both intrinsically, by measuring performance on news story clustering, and extrinsically, by assessing the Fragmentation scores of different simulated news recommender scenarios. Our findings demonstrate that agglomerative hierarchical clustering coupled with SentenceBERT text representation is substantially better at detecting Fragmentation than earlier implementations. Additionally, the analysis of simulated scenarios yields valuable insights and recommendations for stakeholders concerning the measurement and interpretation of Fragmentation.


著者 Alessandra Polimeno,Myrthe Reuver,Sanne Vrijenhoek,Antske Fokkens
発行日 2023-09-18 13:05:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CL, cs.CY, cs.IR パーマリンク