Privacy-Preserving Neural Graph Databases

要約

ビッグデータと急速に進化する情報システムの時代では、効率的かつ正確なデータ検索がますます重要になっています。
ニューラル グラフ データベース (NGDB) は、グラフ データベース (グラフ DB) とニューラル ネットワークの長所を組み合わせて、グラフ構造データの効率的な保存、検索、分析を可能にする強力なパラダイムとして登場しました。
ニューラル埋め込みストレージと複雑なニューラル論理クエリ応答の使用により、NGDB に一般化機能が提供されます。
グラフが不完全な場合、潜在的なパターンと表現を抽出することで、ニューラル グラフ データベースはグラフ構造のギャップを埋め、隠れた関係を明らかにし、正確なクエリ応答を可能にします。
ただし、この機能には、データベースに追加のプライバシー リスクが生じるため、固有のトレードオフが伴います。
悪意のある攻撃者は、1950 年以前に生まれたチューリング賞受賞者と 1940 年以降に生まれたチューリング賞受賞者の居住地に関する回答セットを比較するなど、適切に設計された組み合わせクエリを使用して、データベース内のより機密性の高い情報を推測することができます。チューリング賞受賞者ヒントンの居住地はおそらく暴露されます。
プライバシー上の懸念から、居住場所はトレーニング中に削除された可能性があります。
この研究では、グラフ埋め込みにおけるプライバシー保護に触発され、NGDB におけるプライバシー漏洩のリスクを軽減するプライバシー保護ニューラル グラフ データベース (P-NGDB) を提案します。
トレーニング段階で敵対的トレーニング手法を導入し、個人情報を使用してクエリを実行した場合に NGDB に区別できない応答を生成させ、複数の無害なクエリを組み合わせて機密情報を推測することの困難さを高めます。
3 つのデータセットに関する広範な実験結果は、P-NGDB がクエリに対して高品質の公開回答を提供しながら、グラフ データベース内の個人情報を効果的に保護できることを示しています。

要約(オリジナル)

In the era of big data and rapidly evolving information systems, efficient and accurate data retrieval has become increasingly crucial. Neural graph databases (NGDBs) have emerged as a powerful paradigm that combines the strengths of graph databases (graph DBs) and neural networks to enable efficient storage, retrieval, and analysis of graph-structured data. The usage of neural embedding storage and complex neural logical query answering provides NGDBs with generalization ability. When the graph is incomplete, by extracting latent patterns and representations, neural graph databases can fill gaps in the graph structure, revealing hidden relationships and enabling accurate query answering. Nevertheless, this capability comes with inherent trade-offs, as it introduces additional privacy risks to the database. Malicious attackers can infer more sensitive information in the database using well-designed combinatorial queries, such as by comparing the answer sets of where Turing Award winners born before 1950 and after 1940 lived, the living places of Turing Award winner Hinton are probably exposed, although the living places may have been deleted in the training due to the privacy concerns. In this work, inspired by the privacy protection in graph embeddings, we propose a privacy-preserving neural graph database (P-NGDB) to alleviate the risks of privacy leakage in NGDBs. We introduce adversarial training techniques in the training stage to force the NGDBs to generate indistinguishable answers when queried with private information, enhancing the difficulty of inferring sensitive information through combinations of multiple innocuous queries. Extensive experiment results on three datasets show that P-NGDB can effectively protect private information in the graph database while delivering high-quality public answers responses to queries.

arxiv情報

著者 Qi Hu,Haoran Li,Jiaxin Bai,Yangqiu Song
発行日 2024-01-19 14:08:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CR, cs.DB, cs.LG パーマリンク