Fairness and Privacy in Federated Learning and Their Implications in Healthcare

要約

現在、分散学習が困難であるか、セキュリティや通信の制限によって制限されている状況が数多く存在します。
これが考慮される一般的な領域の 1 つは、データが HIPAA などのデータ使用規則によって管理されることが多い医療分野です。
一方で、より大きな変動性があり、過小評価されているクラスのバランスをとる可能性があるため、モデルをより一般化できるようにするには、より大きなサンプル サイズと共有データ モデルが必要です。
フェデレーテッド ラーニングは、分散学習モデルの一種で、分散型方法でデータをトレーニングできるようにします。
これにより、データ自体は特定の学習ネットワーク ノード間で共有されないため、データのセキュリティ、プライバシー、脆弱性に関する考慮事項に対処できます。
フェデレーテッド ラーニングに対する 3 つの主な課題には、ノード データが独立しておらず同一分散 (iid) ではないこと、クライアントがピア間で高レベルの通信オーバーヘッドを必要とすること、データセットのバイアスとサイズに関してネットワーク内に異なるクライアントが存在することなどが挙げられます。
この分野が成長するにつれて、フェデレーション ラーニングにおける公平性の概念も、新しい実装を通じて導入されてきました。
公平性のアプローチは、フェデレーテッド ラーニングの標準形式とは異なり、ヘルスケア領域に関しては明確な課題と考慮事項もあります。
このペーパーでは、研究における公平なフェデレーション ラーニングの典型的なライフサイクルを概説するとともに、実装における公平性の現状を説明するための最新の分類法を提供することを目的としています。
最後に、このホワイトペーパーでは、ヘルスケア領域におけるフェデレーテッド ラーニングの公平性の実装とサポートの意味と課題について、さらなる洞察を提供します。

要約(オリジナル)

Currently, many contexts exist where distributed learning is difficult or otherwise constrained by security and communication limitations. One common domain where this is a consideration is in Healthcare where data is often governed by data-use-ordinances like HIPAA. On the other hand, larger sample sizes and shared data models are necessary to allow models to better generalize on account of the potential for more variability and balancing underrepresented classes. Federated learning is a type of distributed learning model that allows data to be trained in a decentralized manner. This, in turn, addresses data security, privacy, and vulnerability considerations as data itself is not shared across a given learning network nodes. Three main challenges to federated learning include node data is not independent and identically distributed (iid), clients requiring high levels of communication overhead between peers, and there is the heterogeneity of different clients within a network with respect to dataset bias and size. As the field has grown, the notion of fairness in federated learning has also been introduced through novel implementations. Fairness approaches differ from the standard form of federated learning and also have distinct challenges and considerations for the healthcare domain. This paper endeavors to outline the typical lifecycle of fair federated learning in research as well as provide an updated taxonomy to account for the current state of fairness in implementations. Lastly, this paper provides added insight into the implications and challenges of implementing and supporting fairness in federated learning in the healthcare domain.

arxiv情報

著者 Navya Annapareddy,Jade Preston,Judy Fox
発行日 2023-08-15 14:32:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CR, cs.LG パーマリンク