要約
ソーシャル メディア プラットフォームにより、情報の迅速な普及と消費が可能になります。
ただし、ユーザーは共有データの信頼性に関係なく、そのようなコンテンツを即座に消費します。
その結果、後者のクラウドソーシング モデルは操作の危険にさらされます。
この研究は、フェイク ニュースをリアルタイムで認識するための説明可能なオンライン分類方法に貢献します。
提案された方法は、教師なしおよび教師ありの両方の機械学習アプローチと、オンラインで作成された語彙を組み合わせます。
プロファイリングは、自然言語処理技術を使用したクリエイター、コンテンツ、コンテキストベースの機能を使用して構築されます。
説明可能な分類メカニズムにより、分類用に選択された特徴と予測の信頼度がダッシュボードに表示されます。
提案されたソリューションのパフォーマンスは Twitter からの実際のデータセットで検証されており、結果は 80% の精度とマクロ F 値を達成しています。
この提案は、データ ストリームの処理、プロファイリング、分類、および説明可能性を共同で提供する最初の提案です。
最終的に、提案されているフェイクニュースの早期検出、隔離、説明は、ソーシャルメディアコンテンツの品質と信頼性の向上に貢献します。
要約(オリジナル)
Social media platforms enable the rapid dissemination and consumption of information. However, users instantly consume such content regardless of the reliability of the shared data. Consequently, the latter crowdsourcing model is exposed to manipulation. This work contributes with an explainable and online classification method to recognize fake news in real-time. The proposed method combines both unsupervised and supervised Machine Learning approaches with online created lexica. The profiling is built using creator-, content- and context-based features using Natural Language Processing techniques. The explainable classification mechanism displays in a dashboard the features selected for classification and the prediction confidence. The performance of the proposed solution has been validated with real data sets from Twitter and the results attain 80 % accuracy and macro F-measure. This proposal is the first to jointly provide data stream processing, profiling, classification and explainability. Ultimately, the proposed early detection, isolation and explanation of fake news contribute to increase the quality and trustworthiness of social media contents.
arxiv情報
著者 | Francisco de Arriba-Pérez,Silvia García-Méndez,Fátima Leal,Benedita Malheiro,Juan Carlos Burguillo |
発行日 | 2024-09-05 10:07:46+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google