LingML: Linguistic-Informed Machine Learning for Enhanced Fake News Detection

要約

現在、ソーシャル メディアで情報が前例のないペースで拡散しており、誤った情報やフェイク ニュースから真実を見極めることが深刻な社会課題となっています。
機械学習 (ML) モデルはフェイク ニュースを特定するために採用されていますが、精度、解釈可能性、一般化可能性の制限などの困難な問題を抱えており、完璧とは程遠いです。
この論文では、言語学入力を使用して ML ベースのソリューションを強化し、フェイク ニュース検出のための言語情報に基づいた ML、LingML を提案します。
私たちは、パンデミック中のフェイクニュースに関する人気のデータセットを使用した実験的研究を実施しました。
実験結果は、私たちが提案したソリューションが非常に効果的であることを示しています。
ML で使用される言語入力のみの場合、10 回の試行中エラーは 2 回未満であり、知識は高度に説明可能です。
言語入力を自然言語処理用の高度な大規模 ML モデルと統合すると、当社のソリューションは平均エラー率 1.8% で既存のソリューションを上回ります。
LingML は、言語学を利用して新しい道を切り開き、効果的かつ効率的なフェイク ニュース検出の最前線を押し広げます。
また、最適なパフォーマンスを達成するために ML とドメインの専門知識の両方を必要とする現実世界の学際的なアプリケーションにも光を当てます。

要約(オリジナル)

Nowadays, Information spreads at an unprecedented pace in social media and discerning truth from misinformation and fake news has become an acute societal challenge. Machine learning (ML) models have been employed to identify fake news but are far from perfect with challenging problems like limited accuracy, interpretability, and generalizability. In this paper, we enhance ML-based solutions with linguistics input and we propose LingML, linguistic-informed ML, for fake news detection. We conducted an experimental study with a popular dataset on fake news during the pandemic. The experiment results show that our proposed solution is highly effective. There are fewer than two errors out of every ten attempts with only linguistic input used in ML and the knowledge is highly explainable. When linguistics input is integrated with advanced large-scale ML models for natural language processing, our solution outperforms existing ones with 1.8% average error rate. LingML creates a new path with linguistics to push the frontier of effective and efficient fake news detection. It also sheds light on real-world multi-disciplinary applications requiring both ML and domain expertise to achieve optimal performance.

arxiv情報

著者 Jasraj Singh,Fang Liu,Hong Xu,Bee Chin Ng,Wei Zhang
発行日 2024-05-07 10:03:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク