Differentially Private Learned Indexes

要約

このペーパーでは、信頼できないプロバイダーが内容を明らかにすることなく暗号化されたユーザー データを処理できるようにする、信頼できる実行環境 (TEE) によって保護された暗号化データベース上の述語クエリに効率的に応答するという問題に取り組みます。
最新のデータベースで述語クエリを高速化する一般的な戦略は、属性値 (キー) を並べ替えられたデータ配列内の対応する位置にマップするインデックスの使用です。
これにより、特定の述語を満たすデータ サブセットの高速な検索と取得が可能になります。
残念ながら、データに依存する漏洩が強力であるため、インデックスを暗号化されたデータベースに直接適用することはできません。
最近のアプローチでは、差分プライバシー (DP) を適用してノイズの多いインデックスを構築し、証明可能なプライバシー保証を維持しながら、暗号化されたデータへの高速アクセスを可能にします。
ただし、これらの方法では、インデックス サイズがキー スペースに比例して増加するため、ストレージ コストが大きくなることがよくあります。
この課題に対処するために、機械学習モデルをインデックス構造として再利用するトレンドの手法である学習済みインデックスを活用して、よりコンパクトな DP インデックスを構築することを提案します。

要約(オリジナル)

In this paper, we address the problem of efficiently answering predicate queries on encrypted databases, those secured by Trusted Execution Environments (TEEs), which enable untrusted providers to process encrypted user data without revealing its contents. A common strategy in modern databases to accelerate predicate queries is the use of indexes, which map attribute values (keys) to their corresponding positions in a sorted data array. This allows for fast lookup and retrieval of data subsets that satisfy specific predicates. Unfortunately, indexes cannot be directly applied to encrypted databases due to strong data dependent leakages. Recent approaches apply differential privacy (DP) to construct noisy indexes that enable faster access to encrypted data while maintaining provable privacy guarantees. However, these methods often suffer from large storage costs, with index sizes typically scaling linearly with the key space. To address this challenge, we propose leveraging learned indexes, a trending technique that repurposes machine learning models as indexing structures, to build more compact DP indexes.

arxiv情報

著者 Jianzhang Du,Tilak Mudgal,Rutvi Rahul Gadre,Yukui Luo,Chenghong Wang
発行日 2024-10-28 16:04:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CR, cs.DB, cs.LG パーマリンク