FNDaaS: Content-agnostic Detection of Fake News sites

要約

自動偽のニュース検出は、誤った情報の広がりにおける困難な問題であり、現実世界の政治的および社会的影響を誇っています。
過去の研究では、このような偽のニュースを検出するための機械学習に基づいた方法を提案し、実際のコンテンツの言語特性など、公開されたニュース記事のさまざまな特性に焦点を当てていますが、それは見かけの言語障壁による制限があります。
Departing from such efforts, we propose Fake News Detection-as-a Service (FNDaaS), the first automatic, content-agnostic fake news detection method, that considers new and unstudied features such as network and structural characteristics per news website.
この方法は、ISPサイドでas-as-a-serviceを強制して、スケーラビリティとメンテナンスを容易にするため、またはユーザー側のエンドユーザーのプライバシーをより優れていることができます。
637の偽物と1183の実際のニュースWebサイトの既存のリストからrawう340k以上のデータポイントを使用して、および提案を実現する概念システムを構築およびテストすることにより、私たちの方法の有効性を実証します。
これらのWebサイトから収集されたデータの分析は、偽のニュースドメインの大部分が非常に若く、実際のニュースよりもドメインに関連付けられたIPの期間が低いように見えることを示しています。
機械学習分類器を使用してさまざまな実験を実施することにより、FNDAAが過去のサイトで最大0.967のAUCスコアを達成できること、新たにフラグを立てられたサイトで最大77-92%の精度を達成できることを実証します。

要約(オリジナル)

Automatic fake news detection is a challenging problem in misinformation spreading, and it has tremendous real-world political and social impacts. Past studies have proposed machine learning-based methods for detecting such fake news, focusing on different properties of the published news articles, such as linguistic characteristics of the actual content, which however have limitations due to the apparent language barriers. Departing from such efforts, we propose Fake News Detection-as-a Service (FNDaaS), the first automatic, content-agnostic fake news detection method, that considers new and unstudied features such as network and structural characteristics per news website. This method can be enforced as-a-Service, either at the ISP-side for easier scalability and maintenance, or user-side for better end-user privacy. We demonstrate the efficacy of our method using more than 340K datapoints crawled from existing lists of 637 fake and 1183 real news websites, and by building and testing a proof of concept system that materializes our proposal. Our analysis of data collected from these websites shows that the vast majority of fake news domains are very young and appear to have lower time periods of an IP associated with their domain than real news ones. By conducting various experiments with machine learning classifiers, we demonstrate that FNDaaS can achieve an AUC score of up to 0.967 on past sites, and up to 77-92% accuracy on newly-flagged ones.

arxiv情報

著者 Panagiotis Papadopoulos,Dimitris Spithouris,Evangelos P. Markatos,Nicolas Kourtellis
発行日 2025-03-18 17:28:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CR, cs.CY, cs.LG パーマリンク