Predicting Sentence-Level Factuality of News and Bias of Media Outlets

要約

自動化されたニュースの信頼性と大規模なファクトチェックには、ニュースの事実とメディアのバイアスを正確に予測する必要があります。
この論文では、AllSides が提案した事実性とメディア バイアスの定義に従って専門的に注釈が付けられた 6,191 文で構成される、「FactNews」と題された大規模な文レベルのデータセットを紹介します。
私たちは、FactNews を使用して、ニュース報道の文レベルの事実性と報道機関の偏りを予測するための 2 つのテキスト分類問題を定式化することにより、ニュース ソースの全体的な信頼性を評価します。
私たちの実験では、偏った文章は感情が優勢であることに加えて、事実に基づいた文章と比較してより多くの単語が表示されることを示しています。
したがって、ニュース記事の主観性と公平性をきめ細かく分析することで、メディアの信頼性を予測する上で有望な結果が得られました。
最後に、ブラジルにおけるフェイクニュースと政治的二極化の深刻さ、そしてポルトガル人に対する調査の不足のため、データセットとベースラインの両方がブラジル系ポルトガル人に対して提案されました。

要約(オリジナル)

Automated news credibility and fact-checking at scale require accurately predicting news factuality and media bias. This paper introduces a large sentence-level dataset, titled ‘FactNews’, composed of 6,191 sentences expertly annotated according to factuality and media bias definitions proposed by AllSides. We use FactNews to assess the overall reliability of news sources, by formulating two text classification problems for predicting sentence-level factuality of news reporting and bias of media outlets. Our experiments demonstrate that biased sentences present a higher number of words compared to factual sentences, besides having a predominance of emotions. Hence, the fine-grained analysis of subjectivity and impartiality of news articles provided promising results for predicting the reliability of media outlets. Finally, due to the severity of fake news and political polarization in Brazil, and the lack of research for Portuguese, both dataset and baseline were proposed for Brazilian Portuguese.

arxiv情報

著者 Francielle Vargas,Kokil Jaidka,Thiago A. S. Pardo,Fabrício Benevenuto
発行日 2024-09-13 13:53:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク