Vax-Culture: A Dataset for Studying Vaccine Discourse on Twitter

要約

タイトル:Vax-Culture: Twitter上のワクチン論説研究のためのデータセット
要約:
– COVID-19パンデミック中、ワクチン接種のための躊躇は引き続き公衆衛生当局にとって主要な課題となっている。この躊躇はワクチンキャンペーンを弱体化させるため、多くの研究者がその根本原因を特定しようとしている。
– 分散する偽情報の増加がこの問題の主要な要因であることがわかっている。ツイッターを、ワクチンに関する誤った情報の源として探索し、ワクチンの誤った情報の拡散を促す重なりあう文化的・政治的信念を抽出することを目的としている。
– これを行うために、通信やジャーナリズムのバックグラウンドを持つ注釈者のチームの助けを借りて、ワクチン関連のツイートのデータセットを収集し、注釈を付けました。
– 最終的には、これが反ワクチンの信念を持つ個人に到達するための効果的かつターゲットを絞った公衆衛生コミュニケーション戦略につながることを望んでいます。また、この情報は、ワクチンに関する誤った情報の投稿を自動的に検出して、その負の影響に対抗する機械学習モデルを開発するのに役立ちます。
– この論文では、6373のワクチン関連ツイートで構成される新しいTwitter COVID-19データセットであるVax-Cultureを提案し、各ツイートのワクチン躊躇、ツイートに不正確な情報が含まれているか、各ツイートで批判され、支持される主体、各ツイートの伝えるメッセージなど、豊富な人間による注釈をつけました。
– さらに、4つの分類タスクと1つのシーケンス生成タスクを含む5つのベースラインタスクを定義し、最近のトランスフォーマーベースのモデルの結果を報告しました。
– データセットとコードは、https://github.com/mrzarei5/Vax-Cultureで公開されています。

要約(オリジナル)

Vaccine hesitancy continues to be a main challenge for public health officials during the COVID-19 pandemic. As this hesitancy undermines vaccine campaigns, many researchers have sought to identify its root causes, finding that the increasing volume of anti-vaccine misinformation on social media platforms is a key element of this problem. We explored Twitter as a source of misleading content with the goal of extracting overlapping cultural and political beliefs that motivate the spread of vaccine misinformation. To do this, we have collected a data set of vaccine-related Tweets and annotated them with the help of a team of annotators with a background in communications and journalism. Ultimately we hope this can lead to effective and targeted public health communication strategies for reaching individuals with anti-vaccine beliefs. Moreover, this information helps with developing Machine Learning models to automatically detect vaccine misinformation posts and combat their negative impacts. In this paper, we present Vax-Culture, a novel Twitter COVID-19 dataset consisting of 6373 vaccine-related tweets accompanied by an extensive set of human-provided annotations including vaccine-hesitancy stance, indication of any misinformation in tweets, the entities criticized and supported in each tweet and the communicated message of each tweet. Moreover, we define five baseline tasks including four classification and one sequence generation tasks, and report the results of a set of recent transformer-based models for them. The dataset and code are publicly available at https://github.com/mrzarei5/Vax-Culture.

arxiv情報

著者 Mohammad Reza Zarei,Michael Christensen,Sarah Everts,Majid Komeili
発行日 2023-04-13 23:04:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL, cs.LG, cs.SI パーマリンク