Measuring Re-identification Risk


コンパクトなユーザー表現 (埋め込みなど) は、パーソナライゼーション サービスのバックボーンを形成します。
私たちのフレームワークは仮説テストに基づいており、攻撃者がユーザーの表現からユーザーの ID を取得できる可能性を正式に制限します。
アプリケーションとして、私たちのフレームワークが、興味に基づく広告のための Chrome の Topics API などの重要な現実世界のアプリケーションをモデル化するのに十分な一般性を備えていることを示します。
Topics API での再識別リスクの推定に使用する、証明可能で優れた再識別攻撃アルゴリズムを示すことで、理論的限界を補完します。


Compact user representations (such as embeddings) form the backbone of personalization services. In this work, we present a new theoretical framework to measure re-identification risk in such user representations. Our framework, based on hypothesis testing, formally bounds the probability that an attacker may be able to obtain the identity of a user from their representation. As an application, we show how our framework is general enough to model important real-world applications such as the Chrome’s Topics API for interest-based advertising. We complement our theoretical bounds by showing provably good attack algorithms for re-identification that we use to estimate the re-identification risk in the Topics API. We believe this work provides a rigorous and interpretable notion of re-identification risk and a framework to measure it that can be used to inform real-world applications.


著者 CJ Carey,Travis Dick,Alessandro Epasto,Adel Javanmard,Josh Karlin,Shankar Kumar,Andres Munoz Medina,Vahab Mirrokni,Gabriel Henrique Nunes,Sergei Vassilvitskii,Peilin Zhong
発行日 2023-07-31 17:35:57+00:00
