Capturing Pertinent Symbolic Features for Enhanced Content-Based Misinformation Detection

要約

誤った情報の拡散を防ぐことは困難です。
誤解を招くコンテンツの検出には、言語やドメインの多様性が非常に大きいため、大きなハードルが生じます。
コンテンツベースのモデルは、ソーシャル メディアの投稿や Web 記事などのテキスト データから表現を学習することで、欺瞞的な言語を識別することに成功しました。
ただし、この異質な現象の代表的なサンプルを集約し、効果的な現実世界のアプリケーションを実装することはまだ困難です。
この論文は、誤情報の言語に関する分析作業に基づいて、この現象を特徴付ける言語的属性と、最も人気のある誤情報データセットの一部がそのような特徴をどのように代表しているかを分析します。
関連する記号知識をニューラル言語モデルと組み合わせて適切に使用すると、誤解を招くコンテンツを検出するのに役立つことを実証します。
私たちの結果は、誤情報データセット全体で最先端のパフォーマンスを達成しており、追加のトレーニング データを必要とせずに、私たちのアプローチがマルチタスク転移学習に代わる有効かつ堅牢な代替手段を提供することを示しています。
さらに、私たちの結果は、構造化された知識が、精度だけでなく時間効率やリソース利用の面でも、誤情報検出のような複雑で予測不可能な現実世界の問題に対処するために必要なさらなる後押しを提供できるという証拠を示しています。

要約(オリジナル)

Preventing the spread of misinformation is challenging. The detection of misleading content presents a significant hurdle due to its extreme linguistic and domain variability. Content-based models have managed to identify deceptive language by learning representations from textual data such as social media posts and web articles. However, aggregating representative samples of this heterogeneous phenomenon and implementing effective real-world applications is still elusive. Based on analytical work on the language of misinformation, this paper analyzes the linguistic attributes that characterize this phenomenon and how representative of such features some of the most popular misinformation datasets are. We demonstrate that the appropriate use of pertinent symbolic knowledge in combination with neural language models is helpful in detecting misleading content. Our results achieve state-of-the-art performance in misinformation datasets across the board, showing that our approach offers a valid and robust alternative to multi-task transfer learning without requiring any additional training data. Furthermore, our results show evidence that structured knowledge can provide the extra boost required to address a complex and unpredictable real-world problem like misinformation detection, not only in terms of accuracy but also time efficiency and resource utilization.

arxiv情報

著者 Flavio Merenda,José Manuel Gómez-Pérez
発行日 2024-01-29 16:42:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク