Study of the performance and scalability of federated learning for medical imaging with intermittent clients

要約

連合学習は、機械学習や深層学習を安全に実行するために用いられるデータ分散プライバシー保護技術である。本論文では、集計演算子の提示、様々なタイプの連携学習、クライアントからのデータ分配に関連して考慮すべき事項など、連携学習に関する理論的側面を、クライアント数が変化するユースケースの網羅的分析とともに紹介する。具体的には、オープンデータリポジトリから取得した胸部X線画像を用いた医用画像解析のユースケースを提案する。プライバシーに関する利点に加え、古典的なケース(中央集権的アプローチ)と比較して、予測精度の向上(精度、損失、曲線下面積)、実行時間の短縮が研究される予定である。訓練データからアンバランスに選択された様々なクライアントをシミュレートする。3クライアントまたは10クライアントを考慮した結果を公開し、それらの間と集中型のケースとで比較する。断続的なクライアントに関連する2つの異なる問題について、それぞれに従うべき2つのアプローチとともに議論する。具体的には、この種の問題は、実際のシナリオでは、あるクライアントがトレーニングから離れ、別のクライアントがトレーニングに入るため、また、クライアントの技術的な問題や接続性の問題により発生する可能性がある。最後に、この分野における改善と今後の課題を提案する。

要約(オリジナル)

Federated learning is a data decentralization privacy-preserving technique used to perform machine or deep learning in a secure way. In this paper we present theoretical aspects about federated learning, such as the presentation of an aggregation operator, different types of federated learning, and issues to be taken into account in relation to the distribution of data from the clients, together with the exhaustive analysis of a use case where the number of clients varies. Specifically, a use case of medical image analysis is proposed, using chest X-Ray images obtained from an open data repository. In addition to the advantages related to privacy, improvements in predictions (in terms of accuracy, loss and area under the curve) and reduction of execution times will be studied with respect to the classical case (the centralized approach). Different clients will be simulated from the training data, selected in an unbalanced manner. The results of considering three or ten clients are exposed and compared between them and against the centralized case. Two different problems related to intermittent clients are discussed, together with two approaches to be followed for each of them. Specifically, this type of problems may occur because in a real scenario some clients may leave the training, and others enter it, and on the other hand because of client technical or connectivity problems. Finally, improvements and future work in the field are proposed.

arxiv情報

著者 Judith Sáinz-Pardo Díaz,Álvaro López García
発行日 2022-11-03 13:05:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.CV, cs.LG, eess.IV パーマリンク