Investigation of Federated Learning Algorithms for Retinal Optical Coherence Tomography Image Classification with Statistical Heterogeneity

要約

目的: フェデレーテッド ラーニングを適用して、複数のクライアントと、クライアント内のデータにいくつかのカテゴリのサンプルが完全に欠けている統計的異種データ分布による現実的なシナリオをシミュレートする OCT 画像分類器をトレーニングします。
方法: OCT 画像分類モデルを分散型でトレーニングし、データの一元化に伴うプライバシーの問題に対処するための FedAvg と FedProx の有効性を調査します。
公開されている OCT データセットを IID および非 IID 設定で複数のクライアントに分割し、各クライアントのサブセットに対してローカル トレーニングを実施しました。
これらの設定について、FedAvg と FedProx という 2 つのフェデレーテッド ラーニング メソッドを評価しました。
結果: データセットでの実験では、IID 設定の下では、どちらの方法も中央データ プールでのトレーニングと同等のパフォーマンスを発揮することがわかりました。
ただし、両方のアルゴリズムのパフォーマンスは、クライアント データ全体にわたる統計的不均一性が増加すると低下しますが、FedProx は、不均一性が増加した設定では一貫して FedAvg よりも優れたパフォーマンスを示します。
結論: 複数の医療機関にわたるプライベート データの利用におけるフェデレーション ラーニングの有効性にもかかわらず、多数のクライアントとラベルの不均一な配布により、両方のアルゴリズムのパフォーマンスが低下します。
特に、FedProx は異質性の増加に対してより堅牢であるようです。

要約(オリジナル)

Purpose: We apply federated learning to train an OCT image classifier simulating a realistic scenario with multiple clients and statistical heterogeneous data distribution where data in the clients lack samples of some categories entirely. Methods: We investigate the effectiveness of FedAvg and FedProx to train an OCT image classification model in a decentralized fashion, addressing privacy concerns associated with centralizing data. We partitioned a publicly available OCT dataset across multiple clients under IID and Non-IID settings and conducted local training on the subsets for each client. We evaluated two federated learning methods, FedAvg and FedProx for these settings. Results: Our experiments on the dataset suggest that under IID settings, both methods perform on par with training on a central data pool. However, the performance of both algorithms declines as we increase the statistical heterogeneity across the client data, while FedProx consistently performs better than FedAvg in the increased heterogeneity settings. Conclusion: Despite the effectiveness of federated learning in the utilization of private data across multiple medical institutions, the large number of clients and heterogeneous distribution of labels deteriorate the performance of both algorithms. Notably, FedProx appears to be more robust to the increased heterogeneity.

arxiv情報

著者 Sanskar Amgain,Prashant Shrestha,Sophia Bano,Ignacio del Valle Torres,Michael Cunniffe,Victor Hernandez,Phil Beales,Binod Bhattarai
発行日 2024-02-15 15:58:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.DC パーマリンク