Bias or Diversity? Unraveling Semantic Discrepancy in U.S. News Headlines


ただし、メディア アウトレット間の不一致を測定し、意味の違いの起源をさらに分析する先行研究は、サンプル サイズが小さく、範囲が限られているという問題があります。
この調査では、2014 年から 2022 年にかけて米国の主要メディアから 180 万件のニュース ヘッドラインの大規模なデータセットを収集し、米国のニュース メディアの意味論的不一致を徹底的に追跡および分析しました。
多重対応分析 (MCA) を使用して、国内政治、経済問題、社会問題、および外交問題の 4 つの主要なトピックに関連する意味の不一致を定量化します。
さらに、メディアの見出しで最も頻繁に使用される n グラムを比較して、分析に対する定性的な洞察をさらに提供します。


There is a broad consensus that news media outlets incorporate ideological biases in their news articles. However, prior studies on measuring the discrepancies among media outlets and further dissecting the origins of semantic differences suffer from small sample sizes and limited scope. In this study, we collect a large dataset of 1.8 million news headlines from major U.S. media outlets spanning from 2014 to 2022 to thoroughly track and dissect the semantic discrepancy in U.S. news media. We employ multiple correspondence analysis (MCA) to quantify the semantic discrepancy relating to four prominent topics – domestic politics, economic issues, social issues, and foreign affairs. Additionally, we compare the most frequent n-grams in media headlines to provide further qualitative insights into our analysis. Our findings indicate that on domestic politics and social issues, the discrepancy can be attributed to a certain degree of media bias. Meanwhile, the discrepancy in reporting foreign affairs is largely attributed to the diversity in individual journalistic styles. Finally, U.S. media outlets show consistency and high similarity in their coverage of economic issues.


著者 Jinsheng Pan,Weihong Qi,Zichen Wang,Hanjia Lyu,Jiebo Luo
発行日 2023-03-28 03:31:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CL パーマリンク