BaIT: Barometer for Information Trustworthiness

要約

この論文では、FNC-1 フェイク ニュース分類タスクへの新しいアプローチを提示します。これには、同様の NLP タスク、つまり文の類似性と自然言語推論から事前にトレーニングされたエンコーダ モデルを採用することが含まれ、このアプローチを使用する 2 つのニューラル ネットワーク アーキテクチャが提案されます。
データ拡張の方法は、データセット内のクラスの不均衡に取り組む手段として検討され、一般的な既存の方法を採用し、新しい文否定アルゴリズムを使用して過小評価されたクラスでサンプルを生成する方法を提案します。
既存のベースラインと同等の全体的なパフォーマンスが達成され、FNC-1 にとって過小評価されているにもかかわらず重要なクラスの精度が大幅に向上します。

要約(オリジナル)

This paper presents a new approach to the FNC-1 fake news classification task which involves employing pre-trained encoder models from similar NLP tasks, namely sentence similarity and natural language inference, and two neural network architectures using this approach are proposed. Methods in data augmentation are explored as a means of tackling class imbalance in the dataset, employing common pre-existing methods and proposing a method for sample generation in the under-represented class using a novel sentence negation algorithm. Comparable overall performance with existing baselines is achieved, while significantly increasing accuracy on an under-represented but nonetheless important class for FNC-1.

arxiv情報

著者 Oisín Nolan,Jeroen van Mourik,Callum Rhys Tilbury
発行日 2023-02-23 06:38:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.LG パーマリンク