Differentially Private Federated Learning of Diffusion Models for Synthetic Tabular Data Generation

要約

金融業界におけるプライバシー保護のデータ分析に対する需要が高まっているため、プライバシー基準を厳格に遵守する合成データ生成のソリューションが必要です。
高忠実度の合成表形式データを生成するように設計された、差分プライバシー、フェデレーテッド ラーニング、ノイズ除去拡散確率モデルを新たに統合した DP-Fed-FinDiff フレームワークを紹介します。
このフレームワークにより、データの有用性を維持しながら、厳格なプライバシー規制への準拠が保証されます。
私たちは、現実世界の複数の金融データセットに対する DP-Fed-FinDiff の有効性を実証し、データ品質を損なうことなくプライバシー保証の大幅な改善を達成しました。
当社の実証的評価により、プライバシー予算、クライアント構成、フェデレーション最適化戦略の間の最適なトレードオフが明らかになります。
この結果は、DP-Fed-FinDiff が高度に規制されたドメインで安全なデータ共有と堅牢な分析を可能にし、フェデレーテッド ラーニングとプライバシー保護データ合成のさらなる進歩への道を開く可能性を裏付けるものです。

要約(オリジナル)

The increasing demand for privacy-preserving data analytics in finance necessitates solutions for synthetic data generation that rigorously uphold privacy standards. We introduce DP-Fed-FinDiff framework, a novel integration of Differential Privacy, Federated Learning and Denoising Diffusion Probabilistic Models designed to generate high-fidelity synthetic tabular data. This framework ensures compliance with stringent privacy regulations while maintaining data utility. We demonstrate the effectiveness of DP-Fed-FinDiff on multiple real-world financial datasets, achieving significant improvements in privacy guarantees without compromising data quality. Our empirical evaluations reveal the optimal trade-offs between privacy budgets, client configurations, and federated optimization strategies. The results affirm the potential of DP-Fed-FinDiff to enable secure data sharing and robust analytics in highly regulated domains, paving the way for further advances in federated learning and privacy-preserving data synthesis.

arxiv情報

著者 Timur Sattarov,Marco Schreyer,Damian Borth
発行日 2024-12-20 17:30:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, q-fin.ST パーマリンク