Unveiling Global Narratives: A Multilingual Twitter Dataset of News Media on the Russo-Ukrainian Conflict

要約

現在進行中のロシアとウクライナの紛争は、世界中で集中的に報道されている。
このトピックを取り巻く世界的な物語を理解することは、その多面的な側面についての洞察を得ることを目指す研究者にとって非常に重要です。
この論文では、ニュース会社やメディア企業が世界中のソーシャル メディアに投稿したツイートを収集して処理することにより、このトピックに焦点を当てた新しいデータセットを紹介します。
2022年2月から2023年5月までのツイートを収集し、60か国語で約150万件のツイートを取得した。
データセット内の各ツイートには処理されたタグが付いており、表現されたエンティティ、スタンス、コンセプト、感情を識別できます。
このデータセットの利用可能性は、現在進行中の紛争をめぐる世界的な物語を、関与している著名な主体が誰であるか、どのような立場をとっているのか、これらの立場はどこから来たのか、どのように異なるのかなど、さまざまな側面から調査することを目的とする研究者にとって貴重なリソースとして役立ちます。
描かれた出来事に関連する概念。

要約(オリジナル)

The ongoing Russo-Ukrainian conflict has been a subject of intense media coverage worldwide. Understanding the global narrative surrounding this topic is crucial for researchers that aim to gain insights into its multifaceted dimensions. In this paper, we present a novel dataset that focuses on this topic by collecting and processing tweets posted by news or media companies on social media across the globe. We collected tweets from February 2022 to May 2023 to acquire approximately 1.5 million tweets in 60 different languages. Each tweet in the dataset is accompanied by processed tags, allowing for the identification of entities, stances, concepts, and sentiments expressed. The availability of the dataset serves as a valuable resource for researchers aiming to investigate the global narrative surrounding the ongoing conflict from various aspects such as who are the prominent entities involved, what stances are taken, where do these stances originate, and how are the different concepts related to the event portrayed.

arxiv情報

著者 Sherzod Hakimov,Gullal S. Cheema
発行日 2023-06-22 13:52:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.DL パーマリンク