The Saudi Privacy Policy Dataset

要約

【タイトル】
サウジアラビアプライバシーポリシーデータセット

【要約】
・サウジアラビア国内の様々なセクターからのアラビア語のプライバシーポリシーを収集したデータセットがあります。このデータセットは、個人データ保護法(PDPL)の10の原則に従って注釈が付けられています。
・PDPLは、世界中で最も包括的なデータ規制の1つである一般データ保護規則(GDPR)と互換性があるように設計されました。
・データは、サウジアラビア中央銀行、サウジアラビア国家統一プラットフォーム、健康保険評議会、Google、Wikipediaなど、複数のソースから収集されました。
・最終的なデータセットには、7つのセクターに属する1,000のウェブサイト、4,638行のテキスト、775,370トークン、および8,353 KBのコーパスサイズが含まれています。
・注釈付きのデータセットは、プライバシーポリシーの遵守を評価し、業界全体でのプライバシー実践のベンチマークを確立し、データ保護規制の遵守を自動的に監視するためのツールを開発するための重要な再利用可能資源を提供しています。
・この論文は、プライバシーポリシー分析、自然言語処理、プライバシーとデータ保護に関連する機械学習アプリケーションのさらなる研究開発を促進すると同時に、サウジアラビアにおけるプライバシー規制の遵守を理解し推進するために、研究者、政策立案者、産業界関係者にとって重要なリソースとなることを目的としています。

要約(オリジナル)

This paper introduces the Saudi Privacy Policy Dataset, a diverse compilation of Arabic privacy policies from various sectors in Saudi Arabia, annotated according to the 10 principles of the Personal Data Protection Law (PDPL); the PDPL was established to be compatible with General Data Protection Regulation (GDPR); one of the most comprehensive data regulations worldwide. Data were collected from multiple sources, including the Saudi Central Bank, the Saudi Arabia National United Platform, the Council of Health Insurance, and general websites using Google and Wikipedia. The final dataset includes 1,000 websites belonging to 7 sectors, 4,638 lines of text, 775,370 tokens, and a corpus size of 8,353 KB. The annotated dataset offers significant reuse potential for assessing privacy policy compliance, benchmarking privacy practices across industries, and developing automated tools for monitoring adherence to data protection regulations. By providing a comprehensive and annotated dataset of privacy policies, this paper aims to facilitate further research and development in the areas of privacy policy analysis, natural language processing, and machine learning applications related to privacy and data protection, while also serving as an essential resource for researchers, policymakers, and industry professionals interested in understanding and promoting compliance with privacy regulations in Saudi Arabia.

arxiv情報

著者 Hend Al-Khalifa,Malak Mashaabi,Ghadi Al-Yahya,Raghad Alnashwan
発行日 2023-04-05 21:40:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.CL パーマリンク