FLAIM: AIM-based Synthetic Data Generation in the Federated Setting

要約

個人のプライバシーを保護しながら共同でのデータ共有を可能にすることは、組織にとって非常に重要です。
合成データの生成は 1 つのソリューションであり、プライベート データの統計的特性を反映する人工データを生成します。
差分プライバシーに基づいて多くの技術が考案されていますが、それらは主にデータが集中化されていることを前提としています。
ただし、データはフェデレーション方式で複数のクライアントに分散されることがよくあります。
この作業では、フェデレーテッド合成表形式データ生成の研究を開始します。
AIM として知られる SOTA の中心的な手法に基づいて、DistAIM と FLAIM を紹介します。
まず、追加のオーバーヘッドを必要とする安全なマルチパーティ計算に基づく最近のアプローチを拡張して、AIM を分散することが簡単であることを示し、フェデレーション シナリオにはあまり適していません。
次に、単純に AIM を統合すると、異質性が存在する場合には実用性が大幅に低下する可能性があることを示します。
両方の問題を軽減するために、異種混合のプライベート プロキシを維持する拡張された FLAIM アプローチを提案します。
さまざまな程度の不均一性の下で、さまざまなベンチマーク データセットにわたってメソッドをシミュレーションし、オーバーヘッドを削減しながらユーティリティを向上できることを示します。

要約(オリジナル)

Preserving individual privacy while enabling collaborative data sharing is crucial for organizations. Synthetic data generation is one solution, producing artificial data that mirrors the statistical properties of private data. While numerous techniques have been devised under differential privacy, they predominantly assume data is centralized. However, data is often distributed across multiple clients in a federated manner. In this work, we initiate the study of federated synthetic tabular data generation. Building upon a SOTA central method known as AIM, we present DistAIM and FLAIM. We first show that it is straightforward to distribute AIM, extending a recent approach based on secure multi-party computation which necessitates additional overhead, making it less suited to federated scenarios. We then demonstrate that naively federating AIM can lead to substantial degradation in utility under the presence of heterogeneity. To mitigate both issues, we propose an augmented FLAIM approach that maintains a private proxy of heterogeneity. We simulate our methods across a range of benchmark datasets under different degrees of heterogeneity and show we can improve utility while reducing overhead.

arxiv情報

著者 Samuel Maddock,Graham Cormode,Carsten Maple
発行日 2024-02-20 16:18:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CR, cs.LG パーマリンク