FedA3I: Annotation Quality-Aware Aggregation for Federated Medical Image Segmentation against Heterogeneous Annotation Noise

要約

フェデレーテッド ラーニング (FL) は、そのプライバシー保護特性により、分散型医療データでセグメンテーション モデルをトレーニングするための有望なパラダイムとして浮上しています。
ただし、既存の研究では、FL のパフォーマンス上限を制限する、現実世界の医療データセットで発生する一般的なアノテーション ノイズを見落としています。
この論文では、私たちは初めてこの問題を特定し、取り組みます。
問題を定式化するために、各クライアント内のピクセル間で非独立かつ同一に分布した (Non-IID) ノイズをモデル化するための等高線展開を提案し、それをマルチソース データの場合に拡張して、異種ノイズ モデル (つまり、非 IID) を形成します。
-クライアント間での IID アノテーション ノイズ)。
このような 2 レベルの非 IID ノイズを含むアノテーションから堅牢な学習を行うために、モデル集約におけるデータ品質の重要性を強調し、高品質のクライアントが FL に大きな影響を与えることができるようにします。
これを達成するために、クライアントごとのノイズ推定に基づく品質係数を導入することにより、FedA3I と呼ばれるアノテーションの品質を意識した集合体を使用したフェデレーテッド ラーニングを提案します。
具体的には、各クライアントでのノイズ推定は混合ガウス モデルを通じて実行され、その後、層ごとの方法でモデルの集約に組み込まれて、高品質のクライアントの重み付けが強化されます。
2 つの現実世界の医療画像セグメンテーション データセットに対する広範な実験により、クロスクライアント アノテーション ノイズに対処する際の最先端のアプローチに対する FedA$^3$I の優れたパフォーマンスが実証されました。
コードは https://github.com/wnn2000/FedAAAI で入手できます。

要約(オリジナル)

Federated learning (FL) has emerged as a promising paradigm for training segmentation models on decentralized medical data, owing to its privacy-preserving property. However, existing research overlooks the prevalent annotation noise encountered in real-world medical datasets, which limits the performance ceilings of FL. In this paper, we, for the first time, identify and tackle this problem. For problem formulation, we propose a contour evolution for modeling non-independent and identically distributed (Non-IID) noise across pixels within each client and then extend it to the case of multi-source data to form a heterogeneous noise model (i.e., Non-IID annotation noise across clients). For robust learning from annotations with such two-level Non-IID noise, we emphasize the importance of data quality in model aggregation, allowing high-quality clients to have a greater impact on FL. To achieve this, we propose Federated learning with Annotation quAlity-aware AggregatIon, named FedA3I, by introducing a quality factor based on client-wise noise estimation. Specifically, noise estimation at each client is accomplished through the Gaussian mixture model and then incorporated into model aggregation in a layer-wise manner to up-weight high-quality clients. Extensive experiments on two real-world medical image segmentation datasets demonstrate the superior performance of FedA$^3$I against the state-of-the-art approaches in dealing with cross-client annotation noise. The code is available at https://github.com/wnn2000/FedAAAI.

arxiv情報

著者 Nannan Wu,Zhaobin Sun,Zengqiang Yan,Li Yu
発行日 2024-01-18 15:27:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク