BAN-PL: a Novel Polish Dataset of Banned Harmful and Offensive Content from Wykop.pl web service

要約

インターネットにはヘイトが溢れているため、NLP 専門家にとってオンライン コンテンツの自動モデレーションを習得することは主要なタスクの 1 つです。
ただし、この分野の進歩には、公開されているソーシャル メディア コンテンツの正確な非合成データセットへのアクセスの改善が必要です。
ポーランド語の場合、そのようなリソースは非常に限られています。
この論文では、ポーランド語の攻撃的なソーシャル メディア コンテンツの新しいオープン データセットを提示することで、このギャップに対処します。
このデータセットは、「Polish Reddit」とも呼ばれる人気のオンライン サービスである Wykop.pl のコンテンツで構成されており、ユーザーによって報告され、内部モデレーション プロセスで禁止されています。
合計 691,662 件の投稿とコメントが含まれており、「有害」と「中立」(「無害」) の 2 つのカテゴリに均等に分類されています。
24,000 個 (各クラス 12,000 個) の部分からなる BAN-PL データセットの匿名化されたサブセットと、前処理スクリプトが公開されました。
さらに、この論文は現実のコンテンツモデレーションプロセスに関する貴重な洞察を提供し、データセットの言語的特徴とコンテンツ特性の分析を詳しく掘り下げています。
さらに、包括的な匿名化手順が細心の注意を払って説明され、適用されています。
モデレーション後バイアスや選択前バイアスなど、同様のデータセットで発生する一般的なバイアスについても説明します。

要約(オリジナル)

Since the Internet is flooded with hate, it is one of the main tasks for NLP experts to master automated online content moderation. However, advancements in this field require improved access to publicly available accurate and non-synthetic datasets of social media content. For the Polish language, such resources are very limited. In this paper, we address this gap by presenting a new open dataset of offensive social media content for the Polish language. The dataset comprises content from Wykop.pl, a popular online service often referred to as the ‘Polish Reddit’, reported by users and banned in the internal moderation process. It contains a total of 691,662 posts and comments, evenly divided into two categories: ‘harmful’ and ‘neutral’ (‘non-harmful’). The anonymized subset of the BAN-PL dataset consisting on 24,000 pieces (12,000 for each class), along with preprocessing scripts have been made publicly available. Furthermore the paper offers valuable insights into real-life content moderation processes and delves into an analysis of linguistic features and content characteristics of the dataset. Moreover, a comprehensive anonymization procedure has been meticulously described and applied. The prevalent biases encountered in similar datasets, including post-moderation and pre-selection biases, are also discussed.

arxiv情報

著者 Anna Kołos,Inez Okulska,Kinga Głąbińska,Agnieszka Karlińska,Emilia Wiśnios,Paweł Ellerik,Andrzej Prałat
発行日 2024-03-26 12:31:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク