Federated Learning for Medical Image Classification: A Comprehensive Benchmark

要約

連邦学習パラダイムは、参加者のプライバシーを保護しながら、孤立した多施設データの機械学習に効果的に対処できるため、医療画像分析の分野に適しています。
ただし、連邦学習における最適化アルゴリズムに関する現在の研究は、主に自然画像を中心とした限られたデータセットとシナリオに焦点を当てており、医学的文脈での比較実験が不十分です。
この作業では、医療イメージングのコンテキストで、いくつかの最先端の連邦学習アルゴリズムの包括的な評価を実施します。
複数の医療画像データセットでさまざまなフェデレーション学習アルゴリズムを使用してトレーニングされた分類モデルの公正な比較を実施します。
さらに、さまざまな連合学習アーキテクチャを検討しながら、通信コストや計算効率などのシステムパフォーマンスメトリックを評価します。
私たちの調査結果は、医療イメージングデータセットが現在の連邦学習最適化アルゴリズムに大きな課題をもたらすことを示しています。
すべての医療連合学習シナリオで一貫して最適なパフォーマンスを提供する単一のアルゴリズムはなく、これらのデータセットに適用すると、多くの最適化アルゴリズムがパフォーマンスを下回る可能性があります。
私たちの実験は、医療イメージングの文脈における連邦学習の将来の研究と適用のためのベンチマークとガイダンスを提供します。
さらに、拡散確率モデルを除去する生成技術とラベルのスムージングとデータセットを増強する効率的で堅牢な方法を提案し、さまざまな医療イメージングデータセットの分類タスクでのフェデレート学習のパフォーマンスを広く強化します。
私たちのコードはGitHubでリリースされ、医療イメージングの将来の連合学習研究のための信頼できる包括的なベンチマークを提供します。

要約(オリジナル)

The federated learning paradigm is wellsuited for the field of medical image analysis, as it can effectively cope with machine learning on isolated multicenter data while protecting the privacy of participating parties. However, current research on optimization algorithms in federated learning often focuses on limited datasets and scenarios, primarily centered around natural images, with insufficient comparative experiments in medical contexts. In this work, we conduct a comprehensive evaluation of several state-of-the-art federated learning algorithms in the context of medical imaging. We conduct a fair comparison of classification models trained using various federated learning algorithms across multiple medical imaging datasets. Additionally, we evaluate system performance metrics, such as communication cost and computational efficiency, while considering different federated learning architectures. Our findings show that medical imaging datasets pose substantial challenges for current federated learning optimization algorithms. No single algorithm consistently delivers optimal performance across all medical federated learning scenarios, and many optimization algorithms may underperform when applied to these datasets. Our experiments provide a benchmark and guidance for future research and application of federated learning in medical imaging contexts. Furthermore, we propose an efficient and robust method that combines generative techniques using denoising diffusion probabilistic models with label smoothing to augment datasets, widely enhancing the performance of federated learning on classification tasks across various medical imaging datasets. Our code will be released on GitHub, offering a reliable and comprehensive benchmark for future federated learning studies in medical imaging.

arxiv情報

著者 Zhekai Zhou,Guibo Luo,Mingzhi Chen,Zhenyu Weng,Yuesheng Zhu
発行日 2025-04-07 16:22:18+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.DC パーマリンク