Intensity-Spatial Dual Masked Autoencoder for Multi-Scale Feature Learning in Chest CT Segmentation


この論文では、Intensity-Spatial Dual Masked AutoEncoder (ISD-MAE) と呼ばれる改良された方法を提案します。
組織コントラストのセミマスク オートエンコーダに基づいて、マスク オートエンコーダ (MAE) ブランチが導入され、マルチスケールの特徴学習およびセグメンテーション タスクのために胸部 CT 画像に対して強度マスキングおよび空間マスキング操作が実行されます。
実験は複数の 2D および 3D データセットで行われます。
結果は、ISD-MAE が 2D 肺炎および縦隔腫瘍セグメンテーション タスクにおいて他の方法よりも大幅に優れていることを示しています。
たとえば、Dice スコアは COVID19 LESION データセットで 90.10% に達し、パフォーマンスは比較的安定しています。
ただし、3D データセットにはまだ改善の余地があります。
これに応じて、損失関数の最適化、強化された 3D 畳み込みブロックの使用、複数の観点からのデータセットの処理などの改善の方向性が提案されています。コードは で入手できます。


In the field of medical image segmentation, challenges such as indistinct lesion features, ambiguous boundaries,and multi-scale characteristics have long revailed. This paper proposes an improved method named Intensity-Spatial Dual Masked AutoEncoder (ISD-MAE). Based on the tissue-contrast semi-masked autoencoder, a Masked AutoEncoder (MAE) branch is introduced to perform intensity masking and spatial masking operations on chest CT images for multi-scale feature learning and segmentation tasks. The model utilizes a dual-branch structure and contrastive learning to enhance the ability to learn tissue features and boundary details. Experiments are conducted on multiple 2D and 3D datasets. The results show that ISD-MAE significantly outperforms other methods in 2D pneumonia and mediastinal tumor segmentation tasks. For example, the Dice score reaches 90.10% on the COVID19 LESION dataset, and the performance is relatively stable. However, there is still room for improvement on 3D datasets. In response to this, improvement directions are proposed, including optimizing the loss function, using enhanced 3D convolution blocks, and processing datasets from multiple perspectives.Our code is available at:


著者 Yuexing Ding,Jun Wang,Hongbing Lyu
発行日 2024-11-20 10:58:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CV, eess.IV パーマリンク