Measuring Re-identification Risk

要約

コンパクトなユーザー表現 (埋め込みなど) は、パーソナライゼーション サービスのバックボーンを形成します。
この研究では、そのようなユーザー表現における再識別リスクを測定するための新しい理論的枠組みを提示します。
私たちのフレームワークは仮説テストに基づいており、攻撃者がユーザーの表現からユーザーの ID を取得できる可能性を正式に制限します。
アプリケーションとして、私たちのフレームワークが、興味に基づく広告のための Chrome の Topics API などの重要な現実世界のアプリケーションをモデル化するのに十分な一般性を備えていることを示します。
Topics API での再識別リスクの推定に使用する、証明可能で優れた再識別攻撃アルゴリズムを示すことで、理論的限界を補完します。
私たちは、この研究が、再識別リスクの厳密で解釈可能な概念と、現実世界のアプリケーションに情報を提供するために使用できる、再識別リスクを測定するためのフレームワークを提供すると信じています。

要約(オリジナル)

Compact user representations (such as embeddings) form the backbone of personalization services. In this work, we present a new theoretical framework to measure re-identification risk in such user representations. Our framework, based on hypothesis testing, formally bounds the probability that an attacker may be able to obtain the identity of a user from their representation. As an application, we show how our framework is general enough to model important real-world applications such as the Chrome’s Topics API for interest-based advertising. We complement our theoretical bounds by showing provably good attack algorithms for re-identification that we use to estimate the re-identification risk in the Topics API. We believe this work provides a rigorous and interpretable notion of re-identification risk and a framework to measure it that can be used to inform real-world applications.

arxiv情報

著者 CJ Carey,Travis Dick,Alessandro Epasto,Adel Javanmard,Josh Karlin,Shankar Kumar,Andres Munoz Medina,Vahab Mirrokni,Gabriel Henrique Nunes,Sergei Vassilvitskii,Peilin Zhong
発行日 2023-07-31 17:35:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CR, cs.LG パーマリンク