MaxStyle: Adversarial Style Composition for Robust Medical Image Segmentation

要約

畳み込みニューラルネットワーク(CNN)は、トレーニングセットとテストセットが同じドメインからのものであるベンチマークデータセットで驚くべきセグメンテーション精度を達成しましたが、それらのパフォーマンスは目に見えないドメインで大幅に低下する可能性があり、多くの臨床シナリオでのCNNの展開を妨げます。
ほとんどの既存の作業は、トレーニング用にマルチドメインデータセットを収集することにより、モデルのドメイン外(OOD)の堅牢性を向上させます。これは、費用がかかり、プライバシーとロジスティックの問題のために常に実行可能とは限りません。
この作業では、単一ドメインのデータセットのみを使用してモデルの堅牢性を向上させることに焦点を当てます。
モデルOODパフォーマンスのスタイル拡張の効果を最大化するMaxStyleと呼ばれる新しいデータ拡張フレームワークを提案します。
補助的なスタイル拡張画像デコーダーをセグメンテーションネットワークに接続して、堅牢な機能学習とデータ拡張を実現します。
重要なことに、MaxStyleは、ノイズのあるスタイルスペースを拡張し、敵対的なトレーニングを介して潜在的な特徴の最悪の場合のスタイル構成を検索することにより、画像スタイルの多様性と硬さを改善してデータを拡張します。
複数の公共の心臓および前立腺のMRデータセットでの広範な実験により、MaxStyleが、目に見えない破損に対する分散外の堅牢性の大幅な向上、および複数の異なる目に見えないサイトと未知の画像シーケンスの両方での一般的な分布シフトにつながることを示しています。
高度なトレーニングデータ設定。
コードはhttps://github.com/cherise215/MaxStyleにあります。

要約(オリジナル)

Convolutional neural networks (CNNs) have achieved remarkable segmentation accuracy on benchmark datasets where training and test sets are from the same domain, yet their performance can degrade significantly on unseen domains, which hinders the deployment of CNNs in many clinical scenarios. Most existing works improve model out-of-domain (OOD) robustness by collecting multi-domain datasets for training, which is expensive and may not always be feasible due to privacy and logistical issues. In this work, we focus on improving model robustness using a single-domain dataset only. We propose a novel data augmentation framework called MaxStyle, which maximizes the effectiveness of style augmentation for model OOD performance. It attaches an auxiliary style-augmented image decoder to a segmentation network for robust feature learning and data augmentation. Importantly, MaxStyle augments data with improved image style diversity and hardness, by expanding the style space with noise and searching for the worst-case style composition of latent features via adversarial training. With extensive experiments on multiple public cardiac and prostate MR datasets, we demonstrate that MaxStyle leads to significantly improved out-of-distribution robustness against unseen corruptions as well as common distribution shifts across multiple, different, unseen sites and unknown image sequences under both low- and high-training data settings. The code can be found at https://github.com/cherise215/MaxStyle.

arxiv情報

著者 Chen Chen,Zeju Li,Cheng Ouyang,Matt Sinclair,Wenjia Bai,Daniel Rueckert
発行日 2022-06-02 21:37:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV, q-bio.QM パーマリンク