Sina at FigNews 2024: Multilingual Datasets Annotated with Bias and Propaganda

要約

ソーシャルメディア上での偏見やプロパガンダの蔓延はますます重大な懸念となっており、自動検出技術の開発につながっています。
この記事は、偏見とプロパガンダについて完全に注釈が付けられた 12,000 件の Facebook 投稿の多言語コーパスを紹介します。
このコーパスは、ガザでのイスラエル戦争を枠組み化するためのニュースメディアの物語に関する FigNews 2024 共有タスクの一部として作成されました。
2023 年 10 月 7 日から 2024 年 1 月 31 日までの戦争中のさまざまな出来事が取り上げられています。このコーパスは、5 つの言語 (アラビア語、ヘブライ語、英語、フランス語、ヒンディー語) で 12,000 件の投稿が含まれており、各言語につき 2,400 件の投稿が含まれています。
注釈のプロセスには、法学を専門とする 10 人の大学院生が参加しました。
コーパスのアノテーションの評価にはアノテーター間合意 (IAA) が使用され、平均 IAA はバイアスについては 80.8%、プロパガンダ アノテーションについては 70.15% でした。
私たちのチームは、バイアスとプロパガンダの両方のサブタスクで最もパフォーマンスの高いチームにランクされました。
コーパスはオープンソースであり、https://sina.birzeit.edu/fada から入手できます。

要約(オリジナル)

The proliferation of bias and propaganda on social media is an increasingly significant concern, leading to the development of techniques for automatic detection. This article presents a multilingual corpus of 12, 000 Facebook posts fully annotated for bias and propaganda. The corpus was created as part of the FigNews 2024 Shared Task on News Media Narratives for framing the Israeli War on Gaza. It covers various events during the War from October 7, 2023 to January 31, 2024. The corpus comprises 12, 000 posts in five languages (Arabic, Hebrew, English, French, and Hindi), with 2, 400 posts for each language. The annotation process involved 10 graduate students specializing in Law. The Inter-Annotator Agreement (IAA) was used to evaluate the annotations of the corpus, with an average IAA of 80.8% for bias and 70.15% for propaganda annotations. Our team was ranked among the bestperforming teams in both Bias and Propaganda subtasks. The corpus is open-source and available at https://sina.birzeit.edu/fada

arxiv情報

著者 Lina Duaibes,Areej Jaber,Mustafa Jarrar,Ahmad Qadi,Mais Qandeel
発行日 2024-07-12 15:04:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク