Memory-aware curriculum federated learning for breast cancer classification

要約

乳がんの早期発見のためには、マンモグラフィー画像診断による定期的な検診が推奨されています。定期的な検診では、陰性サンプルが圧倒的に多いデータセットとなります。このようなクラスの不均衡を解消するためには、複数の機関が力を合わせることが有効です。共同コンピュータ支援診断システムの開発は、様々な点で困難である。患者のプライバシーと規制を慎重に尊重する必要がある。また、複数の機関にまたがるデータは、異なる機器や画像プロトコルから取得される可能性があり、非IIDデータとして異質なものとなる。また、学習ベースの手法では、分散データ上で動作する新しい最適化戦略が必要である。近年、協調学習のための効果的なツールとして、連合学習が登場している。この設定では、ローカルモデルが自分のプライベートなデータに対して計算を行い、グローバルモデルを更新する。ローカルモデルの更新の順番と頻度は、最終的なグローバルモデルに影響を与える。したがって、最適化器に対して局所的に提示されるサンプルの順序は重要な役割を果たす。本研究では、連合環境におけるメモリを考慮したカリキュラム学習法を定義する。我々のカリキュラムは、グローバルモデルの展開後に忘れ去られるサンプルに特別な注意を払いながら、学習サンプルの順序を制御する。本手法は、教師なしドメイン適応と組み合わせることで、データのプライバシーを保護しつつ、ドメインシフトに対応することができる。本手法を異なるベンダーの3つの臨床データセットで評価した.その結果、多施設の乳癌分類における連合敵対的学習の有効性が検証された。さらに、提案するメモリを考慮したカリキュラム手法は、分類性能をさらに向上させるのに有効であることを示す。我々のコードは以下のサイトで公開されている:https://github.com/ameliajimenez/curriculum-federated-learning.

要約(オリジナル)

For early breast cancer detection, regular screening with mammography imaging is recommended. Routinary examinations result in datasets with a predominant amount of negative samples. A potential solution to such class-imbalance is joining forces across multiple institutions. Developing a collaborative computer-aided diagnosis system is challenging in different ways. Patient privacy and regulations need to be carefully respected. Data across institutions may be acquired from different devices or imaging protocols, leading to heterogeneous non-IID data. Also, for learning-based methods, new optimization strategies working on distributed data are required. Recently, federated learning has emerged as an effective tool for collaborative learning. In this setting, local models perform computation on their private data to update the global model. The order and the frequency of local updates influence the final global model. Hence, the order in which samples are locally presented to the optimizers plays an important role. In this work, we define a memory-aware curriculum learning method for the federated setting. Our curriculum controls the order of the training samples paying special attention to those that are forgotten after the deployment of the global model. Our approach is combined with unsupervised domain adaptation to deal with domain shift while preserving data privacy. We evaluate our method with three clinical datasets from different vendors. Our results verify the effectiveness of federated adversarial learning for the multi-site breast cancer classification. Moreover, we show that our proposed memory-aware curriculum method is beneficial to further improve classification performance. Our code is publicly available at: https://github.com/ameliajimenez/curriculum-federated-learning.

arxiv情報

著者 Amelia Jiménez-Sánchez,Mickael Tardy,Miguel A. González Ballester,Diana Mateus,Gemma Piella
発行日 2023-01-06 15:04:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク