要約
本論文では、非常に困難な問題である、かろうじて教師ありのボリュームメトリック医用画像セグメンテーション(BSS)について検討する。BSSの学習データセットは2つの部分から構成される:1)各ラベル付き画像には1スライスの注釈しか含まれていない、ほとんど注釈のないラベル付き集合と、2)多数のラベルなし体積画像から構成されるラベルなし集合。最先端のBSS手法は、レジストレーションベースのパラダイムを採用している。このパラダイムは、スライス間画像レジストレーションを利用して、シングルスライス注釈をボリューム擬似ラベルに伝播させ、完全に注釈されたラベル付き集合を構築し、これに半教師付きセグメンテーションスキームを適用する。しかし、このパラダイムには、画像レジストレーションによって生成される擬似ラベルが信頼性に欠け、ノイズが多いという重大な限界がある。このことに動機づけられ、我々は新しい視点を提案する。すなわち、BSSを半教師付き学習スキームの中で解くのではなく、BSSを教師なし領域適応問題として定式化する。この目的のために、我々は、支配的な登録パラダイムに代わる新しいBSSフレームワークである〚教師なし学習〛を提案する。具体的には、まず、スライスからボリュームへのラベル付きデータ合成のための新しいノイズフリーラベル付きデータ構築アルゴリズム(NFC)を設計する。次に、ドメインシフトを緩和するために、周波数・空間ミックスアップ戦略(FSX)を導入する。広範な実験により、我々の手法がBSSに代わる有望な手法であることが実証された。注目すべきことに、提案手法は、やっとラベル付けされた画像を持つ左心房セグメンテーションデータセットで訓練され、81.20%のDiceスコアを達成し、61.71%で最先端技術を上回る。このコードは、↓↓↓↓↓↓にあります。
要約(オリジナル)
This paper investigates an extremely challenging problem: barely-supervised volumetric medical image segmentation (BSS). A BSS training dataset consists of two parts: 1) a barely-annotated labeled set, where each labeled image contains only a single-slice annotation, and 2) an unlabeled set comprising numerous unlabeled volumetric images. State-of-the-art BSS methods employ a registration-based paradigm, which uses inter-slice image registration to propagate single-slice annotations into volumetric pseudo labels, constructing a completely annotated labeled set, to which a semi-supervised segmentation scheme can be applied. However, the paradigm has a critical limitation: the pseudo-labels generated by image registration are unreliable and noisy. Motivated by this, we propose a new perspective: instead of solving BSS within a semi-supervised learning scheme, this work formulates BSS as an unsupervised domain adaptation problem. To this end, we propose a novel BSS framework, \textbf{B}arely-supervised learning \textbf{via} unsupervised domain \textbf{A}daptation (BvA), as an alternative to the dominant registration paradigm. Specifically, we first design a novel noise-free labeled data construction algorithm (NFC) for slice-to-volume labeled data synthesis. Then, we introduce a frequency and spatial Mix-Up strategy (FSX) to mitigate the domain shifts. Extensive experiments demonstrate that our method provides a promising alternative for BSS. Remarkably, the proposed method, trained on the left atrial segmentation dataset with \textbf{only one} barely-labeled image, achieves a Dice score of 81.20%, outperforming the state-of-the-art by 61.71%. The code is available at \href{https://github.com/Senyh/BvA}{\textit{\texttt{https://github.com/Senyh/BvA}}}.
arxiv情報
著者 | Zhiqiang Shen,Peng Cao,Junming Su,Jinzhu Yang,Osmar R. Zaiane |
発行日 | 2024-09-03 07:46:17+00:00 |
arxivサイト | arxiv_id(pdf) |