UKBOB: One Billion MRI Labeled Masks for Generalizable 3D Medical Image Segmentation

要約

医療イメージングでは、主な課題は、プライバシーの懸念、ロジスティクス、および高いラベルコストのために、大規模なラベル付きデータを収集することです。
この作業では、51,761 MRI 3Dサンプル(1790万の2D画像に相当)と72個のオルガンの13億7000億個以上の2Dセグメンテーションマスク、すべてがUK Biobank MRI Datasetに基づいている英国のバイオバンク臓器と骨(UKBOB)(UKBOB)を紹介します。
自動ラベルを利用して、臓器固有のフィルターを使用した自動ラベルクリーニングパイプラインを導入し、300 MRIのサブセットに11の腹部クラスを手動で注釈して、品質を検証します(UKBOB-Manualと呼ばれます)。
このアプローチにより、ラベルに信頼性を維持しながら、データセットコレクションをスケーリングすることができます。
さらに、フィルタリングされたUKBOB上の訓練されたモデルのゼロショット一般化を、同様のドメインからの他の小さなラベル付きデータセット(腹部MRIなど)にゼロショット一般化を実証することにより、ラベルの妥当性をさらに確認します。
ノイズの多いラベルの効果をさらに軽減するために、セグメンテーション出力を改良するためにエントロピーテスト時間適応(ETTA)と呼ばれる新しい方法を提案します。
UKBOBを使用して、SWIN-UNETRアーキテクチャに基づいた3D医療画像セグメンテーションのために基礎モデルのSwin-BOBをトレーニングし、3D脳腫瘍チャレンジ(0.4%改善を伴う)およびBTCV腹部CTスカンベンチマーク(1.3%改善)を含む3D医療イメージングのいくつかのベンチマークで最先端の結果を達成します。
事前に訓練されたモデルとコードは、https://emmanuelleb985.github.io/ukbobで入手でき、フィルタリングされたラベルは英国のBiobankで利用可能になります。

要約(オリジナル)

In medical imaging, the primary challenge is collecting large-scale labeled data due to privacy concerns, logistics, and high labeling costs. In this work, we present the UK Biobank Organs and Bones (UKBOB), the largest labeled dataset of body organs, comprising 51,761 MRI 3D samples (equivalent to 17.9 million 2D images) and more than 1.37 billion 2D segmentation masks of 72 organs, all based on the UK Biobank MRI dataset. We utilize automatic labeling, introduce an automated label cleaning pipeline with organ-specific filters, and manually annotate a subset of 300 MRIs with 11 abdominal classes to validate the quality (referred to as UKBOB-manual). This approach allows for scaling up the dataset collection while maintaining confidence in the labels. We further confirm the validity of the labels by demonstrating zero-shot generalization of trained models on the filtered UKBOB to other small labeled datasets from similar domains (e.g., abdominal MRI). To further mitigate the effect of noisy labels, we propose a novel method called Entropy Test-time Adaptation (ETTA) to refine the segmentation output. We use UKBOB to train a foundation model, Swin-BOB, for 3D medical image segmentation based on the Swin-UNetr architecture, achieving state-of-the-art results in several benchmarks in 3D medical imaging, including the BRATS brain MRI tumor challenge (with a 0.4% improvement) and the BTCV abdominal CT scan benchmark (with a 1.3% improvement). The pre-trained models and the code are available at https://emmanuelleb985.github.io/ukbob , and the filtered labels will be made available with the UK Biobank.

arxiv情報

著者 Emmanuelle Bourigault,Amir Jamaludin,Abdullah Hamdi
発行日 2025-04-09 14:10:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク