Sentiment Analysis and Effect of COVID-19 Pandemic using College SubReddit Data

要約

背景: 新型コロナウイルス感染症のパンデミックは、私たちの社会と人間の幸福にさまざまな形で影響を与えています。
この研究では、ソーシャルメディアの実世界データを使用して、パンデミック前と比較してパンデミックが人々の感情や心理状態にどのような影響を与えたかを調査します。
方法: 8 つの大学に関連するサブレディット コミュニティから、2019 年 (パンデミック前) と 2020 年 (パンデミック) の Reddit ソーシャル メディア データを収集しました。
私たちは、事前トレーニング済みの堅牢に最適化された BERT 事前トレーニング アプローチ (RoBERTa) を適用して、Reddit メッセージからのテキスト埋め込みを学習し、投稿されたメッセージ間の関係情報を活用して感情分類のためのグラフ アテンション ネットワーク (GAT) をトレーニングしました。
最後に、モデルスタッキングを適用して RoBERTa と GAT からの予測確率を組み合わせ、センチメントに関する最終的な分類を行いました。
収集されたデータのモデルによって予測された感情ラベルを使用して、一般化された線形混合効果モデルを使用して、パンデミックとパンデミック中の対面授業が感情に及ぼす影響を推定しました。
結果: この結果は、2020 年 (パンデミック) に否定的なセンチメントが発生するオッズが 2019 年 (パンデミック前) のオッズよりも 25.7% 高く、$p$ 値が $<0.001$ であることを示唆しています。 また、2020 年の対面学習に関連する否定的な感情の確率は、$p$ 値が 0.029 で、遠隔学習よりも 48.3% 高くなりました。 結論:私たちの研究結果は、パンデミックが人々の感情や心理状態に及ぼす悪影響に関する文献の調査結果と一致しています。 私たちの研究は、パンデミックが私たちの社会に及ぼすさまざまな悪影響に関する現実世界の証拠の増加に貢献します。 また、ML 技術と統計モデリングおよび推論の両方を使用して、現実世界のデータをより有効に活用する良い例も提供します。

要約(オリジナル)

Background: The COVID-19 pandemic has affected our society and human well-being in various ways. In this study, we investigate how the pandemic has influenced people’s emotions and psychological states compared to a pre-pandemic period using real-world data from social media. Method: We collected Reddit social media data from 2019 (pre-pandemic) and 2020 (pandemic) from the subreddits communities associated with eight universities. We applied the pre-trained Robustly Optimized BERT pre-training approach (RoBERTa) to learn text embedding from the Reddit messages, and leveraged the relational information among posted messages to train a graph attention network (GAT) for sentiment classification. Finally, we applied model stacking to combine the prediction probabilities from RoBERTa and GAT to yield the final classification on sentiment. With the model-predicted sentiment labels on the collected data, we used a generalized linear mixed-effects model to estimate the effects of pandemic and in-person teaching during the pandemic on sentiment. Results: The results suggest that the odds of negative sentiments in 2020 (pandemic) were 25.7% higher than the odds in 2019 (pre-pandemic) with a $p$-value $<0.001$; and the odds of negative sentiments associated in-person learning were 48.3% higher than with remote learning in 2020 with a $p$-value of 0.029. Conclusions: Our study results are consistent with the findings in the literature on the negative impacts of the pandemic on people's emotions and psychological states. Our study contributes to the growing real-world evidence on the various negative impacts of the pandemic on our society; it also provides a good example of using both ML techniques and statistical modeling and inference to make better use of real-world data.

arxiv情報

著者 Tian Yan,Fang Liu
発行日 2023-09-18 08:10:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.CY, cs.LG パーマリンク