PolicyLR: A Logic Representation For Privacy Policies

要約

プライバシー ポリシーはオンライン エコシステムにおいて極めて重要であり、サービスがユーザー データをどのように処理し、GDPR や CCPA などの規制に準拠するかを定義します。
ただし、その複雑さと頻繁な更新により、関係者が理解して分析することが困難になることがよくあります。
自然言語処理を利用した現在の自動分析手法には限界があります。
通常、彼らは個々のタスクに焦点を当てており、ポリシーの完全なコンテキストを把握できません。
私たちは、プライバシー ポリシーの包括的な機械可読表現を提供する新しいパラダイムである PolicyLR を提案し、複数の下流タスクに対するオールインワン ソリューションとして機能します。
PolicyLR は、原子式の評価を使用してプライバシー ポリシーを機械可読形式に変換し、コンプライアンスや一貫性などのタスクを正式に定義できるようにします。
私たちは、既製の大規模言語モデル (LLM) を使用して、非構造化ポリシー テキストをこの形式に変換するコンパイラーを開発しました。
このコンパイラは、変換タスクを 2 段階の変換と含意の手順に分割します。
この手順では、プライバシー ポリシーの完全なコンテキストを考慮して、複雑な式を推測します。各式は、より単純な原子式で構成されます。
このモデルの利点は、PolicyLR が設計により解釈可能であり、プライバシー ポリシーのセグメントに基づいていることです。
私たちは、コミュニティによって注釈が付けられたプライバシー ポリシー含意データセットである ToS;DR を使用してコンパイラーを評価しました。
オープンソース LLM を利用することで、当社のコンパイラは精度と再現率の値がそれぞれ 0.91 と 0.88 を達成しました。
最後に、ポリシー コンプライアンス、不一致検出、プライバシー比較ショッピングという 3 つのプライバシー タスクにおける PolicyLR の有用性を示します。

要約(オリジナル)

Privacy policies are crucial in the online ecosystem, defining how services handle user data and adhere to regulations such as GDPR and CCPA. However, their complexity and frequent updates often make them difficult for stakeholders to understand and analyze. Current automated analysis methods, which utilize natural language processing, have limitations. They typically focus on individual tasks and fail to capture the full context of the policies. We propose PolicyLR, a new paradigm that offers a comprehensive machine-readable representation of privacy policies, serving as an all-in-one solution for multiple downstream tasks. PolicyLR converts privacy policies into a machine-readable format using valuations of atomic formulae, allowing for formal definitions of tasks like compliance and consistency. We have developed a compiler that transforms unstructured policy text into this format using off-the-shelf Large Language Models (LLMs). This compiler breaks down the transformation task into a two-stage translation and entailment procedure. This procedure considers the full context of the privacy policy to infer a complex formula, where each formula consists of simpler atomic formulae. The advantage of this model is that PolicyLR is interpretable by design and grounded in segments of the privacy policy. We evaluated the compiler using ToS;DR, a community-annotated privacy policy entailment dataset. Utilizing open-source LLMs, our compiler achieves precision and recall values of 0.91 and 0.88, respectively. Finally, we demonstrate the utility of PolicyLR in three privacy tasks: Policy Compliance, Inconsistency Detection, and Privacy Comparison Shopping.

arxiv情報

著者 Ashish Hooda,Rishabh Khandelwal,Prasad Chalasani,Kassem Fawaz,Somesh Jha
発行日 2024-08-27 07:27:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.CR パーマリンク