MiDe22: An Annotated Multi-Event Tweet Dataset for Misinformation Detection

要約

オンライン ソーシャル ネットワークを通じた誤った情報の急速な拡散は、人間の健康、公共の安全、民主主義、経済を危険にさらす有害な結果を伴う差し迫った問題を引き起こしています。
したがって、この問題に対処するには緊急の措置が必要です。
この研究では、ロシア・ウクライナ戦争、新型コロナウイルス感染症のパンデミック、難民など、2020年から2022年にかけてのいくつかの最近の出来事に関する誤情報ラベルが付いた5,284件の英語ツイートと5,064件のトルコ語ツイートを含む、MiDe22と呼ばれる新しい人間による注釈付きデータセットを構築します。

データセットには、いいね、返信、リツイート、引用などのツイートに対するユーザーのエンゲージメントが含まれています。
また、記述統計を使用した詳細なデータ分析と、誤情報検出のためのベンチマーク評価の実験結果も提供します。

要約(オリジナル)

The rapid dissemination of misinformation through online social networks poses a pressing issue with harmful consequences jeopardizing human health, public safety, democracy, and the economy; therefore, urgent action is required to address this problem. In this study, we construct a new human-annotated dataset, called MiDe22, having 5,284 English and 5,064 Turkish tweets with their misinformation labels for several recent events between 2020 and 2022, including the Russia-Ukraine war, COVID-19 pandemic, and Refugees. The dataset includes user engagements with the tweets in terms of likes, replies, retweets, and quotes. We also provide a detailed data analysis with descriptive statistics and the experimental results of a benchmark evaluation for misinformation detection.

arxiv情報

著者 Cagri Toraman,Oguzhan Ozcelik,Furkan Şahinuç,Fazli Can
発行日 2024-07-11 15:13:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.IR, cs.SI パーマリンク