要約
本論文では、ニュースの見出しに存在する様々な形態のメディア・バイアスを検出するモデルの開発に役立てることを目的としたMediaSpinデータセットを紹介する。このコーパスは78,910組のニュースヘッドラインと、13種類のメディアバイアスカテゴリの説明が付与されたアノテーションから構成される。我々は、ニュース編集における自動偏向検出のためのデータセットの有用性を実証する。
要約(オリジナル)
In this paper, we introduce the MediaSpin dataset aiming to help in the development of models that can detect different forms of media bias present in news headlines, developed through human-supervised and -validated Large Language Model (LLM) labeling of media bias. This corpus comprises 78,910 pairs of news headlines and annotations with explanations of the 13 distinct types of media bias categories assigned. We demonstrate the usefulness of our dataset for automated bias detection in news edits.
arxiv情報
著者 | Preetika Verma,Kokil Jaidka |
発行日 | 2024-12-03 08:41:13+00:00 |
arxivサイト | arxiv_id(pdf) |