Scale Federated Learning for Label Set Mismatch in Medical Image Classification



– フェデレーテッドラーニングは、プライバシー漏洩なしに複数のパーティーが共同でモデルをトレーニングする分散学習パラダイムとして医療領域に導入されています。
– しかし、以前のほとんどの研究では、すべてのクライアントが同一のラベルセットを持っていることを前提としていました。
– 現実には、医療専門家は自分の知識領域または興味範囲内の疾患だけを注釈する傾向があります。これは、各クライアントのラベルセットが異なる場合があり、分離している場合さえあることを意味します。
– この論文では、ラベルセット不一致の問題を解決するためのフレームワークFedLSMを提唱しています。
– FedLSMは、異なる不確実性レベルのデータに対して異なるトレーニング戦略を採用し、ラベルのないまたは部分的にラベルの付いたデータを効率的に利用し、クラスベースの適応的な集計を分類層で採用しています。これにより、クライアントがラベルを欠落している場合に不正確な集計を回避することができます。
– FedLSMを、胸部X線診断用112,120枚のX線画像と皮膚レーション診断用10,015枚のデルモスコープ画像を含む2つの公開実際の医療画像データセットで評価し、他の最先端のFLアルゴリズムよりも優れた性能を示します。このコードは承認後に公開されます。


Federated learning (FL) has been introduced to the healthcare domain as a decentralized learning paradigm that allows multiple parties to train a model collaboratively without privacy leakage. However, most previous studies have assumed that every client holds an identical label set. In reality, medical specialists tend to annotate only diseases within their knowledge domain or interest. This implies that label sets in each client can be different and even disjoint. In this paper, we propose the framework FedLSM to solve the problem Label Set Mismatch. FedLSM adopts different training strategies on data with different uncertainty levels to efficiently utilize unlabeled or partially labeled data as well as class-wise adaptive aggregation in the classification layer to avoid inaccurate aggregation when clients have missing labels. We evaluate FedLSM on two public real-world medical image datasets, including chest x-ray (CXR) diagnosis with 112,120 CXR images and skin lesion diagnosis with 10,015 dermoscopy images, and show that it significantly outperforms other state-of-the-art FL algorithms. Code will be made available upon acceptance.


著者 Zhipeng Deng,Luyang Luo,Hao Chen
発行日 2023-04-14 05:32:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, OpenAI

カテゴリー: cs.CV, cs.LG パーマリンク