Context is Key(NMF): Modelling Topical Information Dynamics in Chinese Diaspora Media

要約

中華人民共和国(PRC)は華人離散メディアを通じて欧州の選挙に干渉しているのか?
この疑問は、ヨーロッパの選挙に関する中国の物語が中国の離散メディアでどのように表現されているか、ひいては中国のニュースメディア操作の目的を探る進行中の研究プロジェクトの基礎となっている。
ディアスポラメディアを効率的かつ大規模に研究するには、トピックモデリングなどの定量的テキスト分析から派生した手法を使用する必要があります。
この論文では、中国メディアにおける情報力学を研究するためのパイプラインを紹介します。
まず、トランスフォーマーベースのコンテキスト埋め込みモデルを使用した静的および動的トピック モデリングへの新しいアプローチである KeyNMF を紹介します。
私たちは、多くの中国のデータセットや指標に対して私たちのアプローチが競争力があることを実証するためにベンチマーク評価を提供しています。
次に、複雑なシステムにおける情報ダイナミクスを記述するための既存の手法と KeyNMF を統合します。
このパイプラインを 5 つのニュース サイトのデータに適用し、2024 年の欧州議会選挙までの期間に焦点を当てます。
私たちの方法と結果は、中国メディアの情報力学を研究するための KeyNMF の有効性を実証し、より広範な研究課題に取り組むさらなる研究の基礎を築きます。

要約(オリジナル)

Does the People’s Republic of China (PRC) interfere with European elections through ethnic Chinese diaspora media? This question forms the basis of an ongoing research project exploring how PRC narratives about European elections are represented in Chinese diaspora media, and thus the objectives of PRC news media manipulation. In order to study diaspora media efficiently and at scale, it is necessary to use techniques derived from quantitative text analysis, such as topic modelling. In this paper, we present a pipeline for studying information dynamics in Chinese media. Firstly, we present KeyNMF, a new approach to static and dynamic topic modelling using transformer-based contextual embedding models. We provide benchmark evaluations to demonstrate that our approach is competitive on a number of Chinese datasets and metrics. Secondly, we integrate KeyNMF with existing methods for describing information dynamics in complex systems. We apply this pipeline to data from five news sites, focusing on the period of time leading up to the 2024 European parliamentary elections. Our methods and results demonstrate the effectiveness of KeyNMF for studying information dynamics in Chinese media and lay groundwork for further work addressing the broader research questions.

arxiv情報

著者 Ross Deans Kristensen-McLachlan,Rebecca M. M. Hicke,Márton Kardos,Mette Thunø
発行日 2024-10-16 17:59:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク