VaxxHesitancy: A Dataset for Studying Hesitancy Towards COVID-19 Vaccination on Twitter

要約

タイトル:VaxxHesitancy: A Dataset for Studying Hesitancy Towards COVID-19 Vaccination on Twitter

要約:

– ワクチン接種に対する不安は常に懸念されてきましたが、SNSの流行とともに、ワクチンに対する懸念を表明する人々と、賛成や反対意見を投稿する人々がオンライン上で同時に活動するようになりました。
– COVID-19ワクチンに関する最初の言及以来、社会的メディアユーザーは迅速に開発されたこれらのワクチンの効果に対する支持や信念、または心配や懸念について投稿してきました。
– COVID-19において、ワクチン接種に対する市民の態度を自動的に検出する手段が必要になってきました。これは、現象についてより深く理解するためにデータ分析が必要な重要な計算社会科学の課題です。
– この目的のために、3,101以上のツイートがCOVID-19ワクチンに対するユーザーの態度(立場)に注釈がつけられた新しいコレクションを作成しました。
– さらに、我々はVaxxBERTと呼ぶドメイン固有言語モデルを開発しました。これは、比較的強力なモデルと比較して、最高の予測性能(73.0の正解率と69.3のF1スコア)を達成しました。
– これらは、賛成や反対の立場とは異なるカテゴリーとしてワクチン不信をモデル化した最初のデータセットとモデルであると認識されています。

要約(オリジナル)

Vaccine hesitancy has been a common concern, probably since vaccines were created and, with the popularisation of social media, people started to express their concerns about vaccines online alongside those posting pro- and anti-vaccine content. Predictably, since the first mentions of a COVID-19 vaccine, social media users posted about their fears and concerns or about their support and belief into the effectiveness of these rapidly developing vaccines. Identifying and understanding the reasons behind public hesitancy towards COVID-19 vaccines is important for policy markers that need to develop actions to better inform the population with the aim of increasing vaccine take-up. In the case of COVID-19, where the fast development of the vaccines was mirrored closely by growth in anti-vaxx disinformation, automatic means of detecting citizen attitudes towards vaccination became necessary. This is an important computational social sciences task that requires data analysis in order to gain in-depth understanding of the phenomena at hand. Annotated data is also necessary for training data-driven models for more nuanced analysis of attitudes towards vaccination. To this end, we created a new collection of over 3,101 tweets annotated with users’ attitudes towards COVID-19 vaccination (stance). Besides, we also develop a domain-specific language model (VaxxBERT) that achieves the best predictive performance (73.0 accuracy and 69.3 F1-score) as compared to a robust set of baselines. To the best of our knowledge, these are the first dataset and model that model vaccine hesitancy as a category distinct from pro- and anti-vaccine stance.

arxiv情報

著者 Yida Mu,Mali Jin,Charlie Grimshaw,Carolina Scarton,Kalina Bontcheva,Xingyi Song
発行日 2023-04-10 18:58:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL パーマリンク