Sentiment Analysis and Text Analysis of the Public Discourse on Twitter about COVID-19 and MPox

要約

Twitter での会話のビッグ データのマイニングと分析は、医療、疫学、ビッグ データ、データ サイエンス、コンピューター サイエンス、およびそれらの関連分野の科学コミュニティにとって大きな関心を集めています。
ここ数年は、エボラ出血熱、大腸菌、デング熱、ヒトパピローマウイルス、中東呼吸器症候群、麻疹、ジカウイルス、H1N1、インフルエンザ様疾患、豚インフルエンザ、インフルエンザ、
コレラ、リステリア症、癌、肝臓病、炎症性腸疾患、腎臓病、狼瘡、パーキンソン病、ジフテリア、西ナイルウイルス。
最近の新型コロナウイルス感染症 (COVID-19) と MPox の発生は、これら両方のウイルスに関係する情報、見解、意見、感情を求め、共有するために Twitter が使用されるきっかけとなりました。
この分野のこれまでの研究では、新型コロナウイルス感染症 (COVID-19) と MPox の両方に同時に焦点を当てたツイートを分析したものはありませんでした。
この研究ギャップに対処するために、2022年5月7日から2023年3月3日までに投稿された、MPoxと新型コロナウイルス感染症に同時に焦点を当てた合計61,862件のツイートが調査されました。
この研究の発見と貢献は多岐にわたります。
まず、VADER アプローチを使用した感情分析の結果は、ツイートのほぼ半数が否定的な感情を持っていることを示しています。
続いて、肯定的な感情を持つツイートと中立的な感情を持つツイートがそれぞれ続きました。
次に、このペーパーでは、これらのツイートで使用されているハッシュタグの上位 50 個を紹介します。
3 番目に、トークン化、ストップワードの削除、単語頻度分析を実行した後、これらのツイートで最も頻繁に使用された単語の上位 100 個が表示されます。
最後に、この研究の関連性と新規性をさらに裏付けるために、この論文の貢献をこの分野の 49 の先行研究と比較する包括的な比較研究が提示されます。

要約(オリジナル)

Mining and analysis of the big data of Twitter conversations have been of significant interest to the scientific community in the fields of healthcare, epidemiology, big data, data science, computer science, and their related areas, as can be seen from several works in the last few years that focused on sentiment analysis and other forms of text analysis of tweets related to Ebola, E-Coli, Dengue, Human Papillomavirus, Middle East Respiratory Syndrome, Measles, Zika virus, H1N1, influenza like illness, swine flu, flu, Cholera, Listeriosis, cancer, Liver Disease, Inflammatory Bowel Disease, kidney disease, lupus, Parkinsons, Diphtheria, and West Nile virus. The recent outbreaks of COVID-19 and MPox have served as catalysts for Twitter usage related to seeking and sharing information, views, opinions, and sentiments involving both of these viruses. None of the prior works in this field analyzed tweets focusing on both COVID-19 and MPox simultaneously. To address this research gap, a total of 61,862 tweets that focused on MPox and COVID-19 simultaneously, posted between 7 May 2022 and 3 March 2023, were studied. The findings and contributions of this study are manifold. First, the results of sentiment analysis using the VADER approach show that nearly half the tweets had a negative sentiment. It was followed by tweets that had a positive sentiment and tweets that had a neutral sentiment, respectively. Second, this paper presents the top 50 hashtags used in these tweets. Third, it presents the top 100 most frequently used words in these tweets after performing tokenization, removal of stopwords, and word frequency analysis. Finally, a comprehensive comparative study that compares the contributions of this paper with 49 prior works in this field is presented to further uphold the relevance and novelty of this work.

arxiv情報

著者 Nirmalya Thakur
発行日 2023-12-17 01:50:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SI パーマリンク