Predicting Sentence-Level Factuality of News and Bias of Media Outlets


この論文では、AllSides が提案した事実性とメディア バイアスの定義に従って専門的に注釈が付けられた 6,191 文で構成される、「FactNews」と題された大規模な文レベルのデータセットを紹介します。
私たちは、FactNews を使用して、ニュース報道の文レベルの事実性と報道機関の偏りを予測するための 2 つのテキスト分類問題を定式化することにより、ニュース ソースの全体的な信頼性を評価します。


Automated news credibility and fact-checking at scale require accurately predicting news factuality and media bias. This paper introduces a large sentence-level dataset, titled ‘FactNews’, composed of 6,191 sentences expertly annotated according to factuality and media bias definitions proposed by AllSides. We use FactNews to assess the overall reliability of news sources, by formulating two text classification problems for predicting sentence-level factuality of news reporting and bias of media outlets. Our experiments demonstrate that biased sentences present a higher number of words compared to factual sentences, besides having a predominance of emotions. Hence, the fine-grained analysis of subjectivity and impartiality of news articles provided promising results for predicting the reliability of media outlets. Finally, due to the severity of fake news and political polarization in Brazil, and the lack of research for Portuguese, both dataset and baseline were proposed for Brazilian Portuguese.


著者 Francielle Vargas,Kokil Jaidka,Thiago A. S. Pardo,Fabrício Benevenuto
発行日 2023-06-28 21:11:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CL パーマリンク