FedER: Federated Learning through Experience Replay and Privacy-Preserving Data Synthesis

要約

医療分野では、患者データと臨床データの不均一性を活用して、より一般化可能な結果を​​得るために、多施設共同研究が求められることがよくあります。
ただし、最近のプライバシー規制により、データを共有する可能性が妨げられ、その結果、診断と予後をサポートする機械学習ベースのソリューションを考え出すことができなくなりました。
フェデレーテッド ラーニング (FL) は、AI ベースのソリューションをデータ所有者に提供し、ローカル AI モデルまたはその一部のみを共有することで、この制限を回避することを目的としています。
ただし、既存の連合学習ソリューションのほとんどはまだ初期段階にあり、モデルの更新から実際のデータが再構築される可能性があるため、ローカルで学習した知識を保持できる信頼性が高く効果的な集約スキームの欠如から、プライバシー保護の脆弱性まで、いくつかの欠点を示しています。
さらに、これらのアプローチの大部分、特に医療データを扱うアプローチは、堅牢性、スケーラビリティ、および信頼の問題を引き起こす集中型分散学習戦略に依存しています。
この論文では、フェデレーテッドおよび分散型学習戦略である FedER を提示します。これは、経験の再生と生成的な敵対的概念を活用し、ローカル ノードからの機能を効果的に統合し、プライバシーを維持しながら複数のデータセットにわたって一般化できるモデルを提供します。
FedER は 2 つのタスク (結核と黒色腫の分類) でテストされており、現実的な非 I.I.D. をシミュレートするために複数のデータセットを使用しています。
医療データのシナリオ。
結果は、私たちのアプローチが標準的な (非フェデレーション) 学習に匹敵するパフォーマンスを達成し、集中化された (したがって、より有利な) 定式化において最先端のフェデレーション メソッドよりも大幅に優れていることを示しています。
コードは https://github.com/perceivelab/FedER で入手できます

要約(オリジナル)

In the medical field, multi-center collaborations are often sought to yield more generalizable findings by leveraging the heterogeneity of patient and clinical data. However, recent privacy regulations hinder the possibility to share data, and consequently, to come up with machine learning-based solutions that support diagnosis and prognosis. Federated learning (FL) aims at sidestepping this limitation by bringing AI-based solutions to data owners and only sharing local AI models, or parts thereof, that need then to be aggregated. However, most of the existing federated learning solutions are still at their infancy and show several shortcomings, from the lack of a reliable and effective aggregation scheme able to retain the knowledge learned locally to weak privacy preservation as real data may be reconstructed from model updates. Furthermore, the majority of these approaches, especially those dealing with medical data, relies on a centralized distributed learning strategy that poses robustness, scalability and trust issues. In this paper we present a federated and decentralized learning strategy, FedER, that, exploiting experience replay and generative adversarial concepts, effectively integrates features from local nodes, providing models able to generalize across multiple datasets while maintaining privacy. FedER is tested on two tasks — tuberculosis and melanoma classification — using multiple datasets in order to simulate realistic non-i.i.d. medical data scenarios. Results show that our approach achieves performance comparable to standard (non-federated) learning and significantly outperforms state-of-the-art federated methods in their centralized (thus, more favourable) formulation. Code is available at https://github.com/perceivelab/FedER

arxiv情報

著者 Matteo Pennisi,Federica Proietto Salanitri,Giovanni Bellitto,Bruno Casella,Marco Aldinucci,Simone Palazzo,Concetto Spampinato
発行日 2023-02-22 12:49:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 68T07, cs.AI, cs.LG, I.2.6 パーマリンク