Fake News Detection and Behavioral Analysis: Case of COVID-19

要約

世界は3年以上にわたり新型コロナウイルス感染症と闘ってきたが、パンデミックに関するフェイクニュースの拡散による進行中の「インフォデミック」も世界的な問題となっている。
フェイクニュースの存在は、政治、公衆衛生、経済活動など、私たちの日常生活のさまざまな側面に影響を与えます。読者はフェイクニュースを本物のニュースと間違える可能性があり、その結果、本物の情報にアクセスできなくなります。
この現象は、国民の混乱や社会の軋轢を引き起こす可能性があります。
現在、フェイクニュース研究には大きな課題があります。
ソーシャルメディア投稿内のフェイクニュースデータを正確に特定することは困難です。
フェイクニュースデータの量が膨大であるため、時間内に人間を特定することは不可能です。
さらに、フェイクニュースで議論されるトピックは、本物のニュースと類似しているため、特定するのが困難です。
この論文の目的は、ソーシャルメディア上のフェイクニュースを特定し、拡散を阻止することです。
フェイクニュース検出のための深層学習アプローチとアンサンブルアプローチを紹介します。
私たちの検出モデルは、以前の研究よりも高い精度を達成しました。
アンサンブルアプローチにより、検出パフォーマンスがさらに向上しました。
私たちは、フェイクニュースと本物のニュースの特徴の違いを発見しました。
これらを文の埋め込みに追加すると、モデルのパフォーマンスに影響を与えることがわかりました。
私たちはハイブリッド手法を適用し、投稿からトピックを認識するためのモデルを構築しました。
特定されたトピックの半分はフェイク ニュースと本物のニュースで重複しており、人々の混乱を増大させる可能性があることがわかりました。

要約(オリジナル)

While the world has been combating COVID-19 for over three years, an ongoing ‘Infodemic’ due to the spread of fake news regarding the pandemic has also been a global issue. The existence of the fake news impact different aspect of our daily lives, including politics, public health, economic activities, etc. Readers could mistake fake news for real news, and consequently have less access to authentic information. This phenomenon will likely cause confusion of citizens and conflicts in society. Currently, there are major challenges in fake news research. It is challenging to accurately identify fake news data in social media posts. In-time human identification is infeasible as the amount of the fake news data is overwhelming. Besides, topics discussed in fake news are hard to identify due to their similarity to real news. The goal of this paper is to identify fake news on social media to help stop the spread. We present Deep Learning approaches and an ensemble approach for fake news detection. Our detection models achieved higher accuracy than previous studies. The ensemble approach further improved the detection performance. We discovered feature differences between fake news and real news items. When we added them into the sentence embeddings, we found that they affected the model performance. We applied a hybrid method and built models for recognizing topics from posts. We found half of the identified topics were overlapping in fake news and real news, which could increase confusion in the population.

arxiv情報

著者 Chih-Yuan Li,Navya Martin Kollapally,Soon Ae Chun,James Geller
発行日 2023-05-25 13:42:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 68, cs.CL, cs.LG パーマリンク