Vax-Culture: A Dataset for Studying Vaccine Discourse on Twitter

要約

タイトル: Vax-Culture: Twitter上のワクチン論争を研究するためのデータセット

要約:
– COVID-19パンデミック中、ワクチン反対運動は公衆衛生当局にとって重要な課題であり続けている。
– 誤情報が蔓延するソーシャルメディアプラットフォームの増加が、この問題の主要因であることが分かったため、ツイッターを誤情報の源として探求した。
– これを行うために、私たちはワクチンに関連するツイートのデータセットを収集し、ジャーナリズムとコミュニケーションの背景を持つ注釈者のチームの支援を得て注釈をつけた。
– 最終的に、これが反ワクチン信念を持つ個人に到達するための効果的かつターゲットされた公衆衛生コミュニケーション戦略につながることを望んでいる。
– さらに、この情報は、ワクチン誤情報投稿を自動的に検出し、その否定的な影響に対抗するための機械学習モデルの開発に役立ちます。
– 本論文では、Vax-Cultureという、ツイッターCOVID-19データセットを紹介しています。このデータセットには、6373件のワクチン関連ツイートが含まれており、ヒューマンプロバイダによるアノテーションが付いています。
– アノテーションには、ワクチンに対する反対の立場、ツイート内に誤情報があることの示唆、各ツイートで批判されたエンティティや支持されたエンティティ、そして各ツイートの伝えたメッセージが含まれます。
– また、4つの分類タスクと1つのシーケンス生成タスクを含む5つのベースラインタスクを定義し、最近のトランスフォーマーベースのモデルの結果を報告しています。
– データセットとコードは、https://github.com/mrzarei5/Vax-Cultureで公開されています。

要約(オリジナル)

Vaccine hesitancy continues to be a main challenge for public health officials during the COVID-19 pandemic. As this hesitancy undermines vaccine campaigns, many researchers have sought to identify its root causes, finding that the increasing volume of anti-vaccine misinformation on social media platforms is a key element of this problem. We explored Twitter as a source of misleading content with the goal of extracting overlapping cultural and political beliefs that motivate the spread of vaccine misinformation. To do this, we have collected a data set of vaccine-related Tweets and annotated them with the help of a team of annotators with a background in communications and journalism. Ultimately we hope this can lead to effective and targeted public health communication strategies for reaching individuals with anti-vaccine beliefs. Moreover, this information helps with developing Machine Learning models to automatically detect vaccine misinformation posts and combat their negative impacts. In this paper, we present Vax-Culture, a novel Twitter COVID-19 dataset consisting of 6373 vaccine-related tweets accompanied by an extensive set of human-provided annotations including vaccine-hesitancy stance, indication of any misinformation in tweets, the entities criticized and supported in each tweet and the communicated message of each tweet. Moreover, we define five baseline tasks including four classification and one sequence generation tasks, and report the results of a set of recent transformer-based models for them. The dataset and code are publicly available at https://github.com/mrzarei5/Vax-Culture.

arxiv情報

著者 Mohammad Reza Zarei,Michael Christensen,Sarah Everts,Majid Komeili
発行日 2023-04-17 16:51:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL, cs.LG, cs.SI パーマリンク