Think Twice Before Selection: Federated Evidential Active Learning for Medical Image Analysis with Domain Shifts

要約

フェデレーテッド ラーニングは、データを一元管理することなく、分散した複数の医療機関にわたるグローバル モデルの共同学習を促進します。
それにもかかわらず、ローカル クライアントでのアノテーションにかかる高価なコストは、依然としてローカル データを効果的に利用する上での障害となっています。
この問題を軽減するために、フェデレーテッド アクティブ ラーニング手法では、ローカルおよびグローバル モデルの予測を活用して、注釈用に比較的少量の有益なローカル データを選択することを提案しています。
ただし、既存の方法は主に同じドメインからサンプリングされたすべてのローカル データに焦点を当てているため、異なるクライアント間でドメインが移動する現実的な医療シナリオでは信頼性が低くなります。
この論文では、多様なドメインから得られたローカルデータの有益性を評価する最初の試みを行い、ドメインシフトの下でデータ評価を調整するための Federated Evidential Active Learning (FEAL) と呼ばれる新しい方法論を提案します。
具体的には、局所モデルと大域モデルの両方にディリクレ事前分布を導入して、予測を確率単体上の分布として扱い、ディリクレに基づく証拠モデルを使用して偶然と認識の不確実性の両方を捕捉します。
次に、認識的な不確実性を使用して、偶然的な不確実性を調整します。
その後、データの冗長性を削減し、データの多様性を維持するための多様性緩和戦略を設計します。
5 つの実際の多施設医療画像データセットに関する広範な実験と分析により、ドメイン シフトを伴う連合シナリオにおける最先端のアクティブ ラーニング手法に対する FEAL の優位性が実証されています。
コードは https://github.com/JiayiChen815/FEAL で入手できます。

要約(オリジナル)

Federated learning facilitates the collaborative learning of a global model across multiple distributed medical institutions without centralizing data. Nevertheless, the expensive cost of annotation on local clients remains an obstacle to effectively utilizing local data. To mitigate this issue, federated active learning methods suggest leveraging local and global model predictions to select a relatively small amount of informative local data for annotation. However, existing methods mainly focus on all local data sampled from the same domain, making them unreliable in realistic medical scenarios with domain shifts among different clients. In this paper, we make the first attempt to assess the informativeness of local data derived from diverse domains and propose a novel methodology termed Federated Evidential Active Learning (FEAL) to calibrate the data evaluation under domain shift. Specifically, we introduce a Dirichlet prior distribution in both local and global models to treat the prediction as a distribution over the probability simplex and capture both aleatoric and epistemic uncertainties by using the Dirichlet-based evidential model. Then we employ the epistemic uncertainty to calibrate the aleatoric uncertainty. Afterward, we design a diversity relaxation strategy to reduce data redundancy and maintain data diversity. Extensive experiments and analysis on five real multi-center medical image datasets demonstrate the superiority of FEAL over the state-of-the-art active learning methods in federated scenarios with domain shifts. The code will be available at https://github.com/JiayiChen815/FEAL.

arxiv情報

著者 Jiayi Chen,Benteng Ma,Hengfei Cui,Yong Xia
発行日 2024-04-22 13:11:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク