Federated Knowledge Recycling: Privacy-Preserving Synthetic Data Sharing

要約

フェデレーテッド ラーニングは共同学習のパラダイムとして登場し、機密データを一元管理することなく堅牢なモデルの開発を可能にします。
ただし、従来のフェデレーテッド ラーニング技術には、モ​​デル、パラメータ、またはアップデートが公開されるため、プライバシーとセキュリティの脆弱性があり、攻撃対象として悪用される可能性があります。
このペーパーでは、ローカルで生成された合成データを使用して機関間のコラボレーションを促進する、サイロ間のフェデレーテッド ラーニング アプローチである Federated Knowledge Recycling (FedKR) について説明します。
FedKR は、高度なデータ生成技術と動的集約プロセスを組み合わせて、既存の方法よりもプライバシー攻撃に対するセキュリティを強化し、攻撃対象領域を大幅に削減します。
一般データセットと医療データセットに関する実験結果では、FedKR がローカル データからのトレーニング モデルと比較して精度が平均 4.24% 向上し、競争力のあるパフォーマンスを達成していることが示されており、データ不足のシナリオで特に有効であることが実証されています。

要約(オリジナル)

Federated learning has emerged as a paradigm for collaborative learning, enabling the development of robust models without the need to centralise sensitive data. However, conventional federated learning techniques have privacy and security vulnerabilities due to the exposure of models, parameters or updates, which can be exploited as an attack surface. This paper presents Federated Knowledge Recycling (FedKR), a cross-silo federated learning approach that uses locally generated synthetic data to facilitate collaboration between institutions. FedKR combines advanced data generation techniques with a dynamic aggregation process to provide greater security against privacy attacks than existing methods, significantly reducing the attack surface. Experimental results on generic and medical datasets show that FedKR achieves competitive performance, with an average improvement in accuracy of 4.24% compared to training models from local data, demonstrating particular effectiveness in data scarcity scenarios.

arxiv情報

著者 Eugenio Lomurno,Matteo Matteucci
発行日 2024-07-30 13:56:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG パーマリンク