SpineMamba: Enhancing 3D Spinal Segmentation in Clinical Imaging through Residual Visual Mamba Layers and Shape Priors

要約

3D 臨床医療画像の正確なセグメンテーションは、脊椎疾患の診断と治療において重要です。
しかし、脊椎の解剖学的構造に固有の複雑さと現在のイメージング技術に固有の不確実性により、脊椎画像のセマンティック セグメンテーションには重大な課題が生じています。
畳み込みニューラル ネットワーク (CNN) と Transformer ベースのモデルは、脊椎セグメンテーションにおいてある程度の進歩を遂げましたが、長距離の依存関係の処理における限界により、セグメンテーションの精度のさらなる向上が妨げられています。これらの課題に対処するために、残余のビジュアル Mamba レイヤーを導入して効果的にキャプチャします。
3D 脊椎データの深い意味論的特徴と長距離空間依存性をモデル化します。
椎骨の構造意味論的理解をさらに強化するために、医療画像から脊椎の特定の解剖学的情報をキャプチャする新しい脊椎形状事前モジュールも提案し、椎骨の構造意味論情報を抽出するモデルの能力を大幅に強化します。
2 つのデータセットの比較実験とアブレーション実験により、SpineMamba が既存の最先端モデルよりも優れていることが実証されました。
CT データセットでは、セグメンテーションの平均 Dice 類似性係数は 94.40 に達しますが、MR データセットでは 86.95 に達します。
特に、有名な nnU-Net と比較して、SpineMamba は、それを最大 2 パーセント上回る優れたセグメンテーション パフォーマンスを実現しています。
これは、その精度、堅牢性、および優れた汎用化機能を強調しています。

要約(オリジナル)

Accurate segmentation of 3D clinical medical images is critical in the diagnosis and treatment of spinal diseases. However, the inherent complexity of spinal anatomy and uncertainty inherent in current imaging technologies, poses significant challenges for semantic segmentation of spinal images. Although convolutional neural networks (CNNs) and Transformer-based models have made some progress in spinal segmentation, their limitations in handling long-range dependencies hinder further improvements in segmentation accuracy.To address these challenges, we introduce a residual visual Mamba layer to effectively capture and model the deep semantic features and long-range spatial dependencies of 3D spinal data. To further enhance the structural semantic understanding of the vertebrae, we also propose a novel spinal shape prior module that captures specific anatomical information of the spine from medical images, significantly enhancing the model’s ability to extract structural semantic information of the vertebrae. Comparative and ablation experiments on two datasets demonstrate that SpineMamba outperforms existing state-of-the-art models. On the CT dataset, the average Dice similarity coefficient for segmentation reaches as high as 94.40, while on the MR dataset, it reaches 86.95. Notably, compared to the renowned nnU-Net, SpineMamba achieves superior segmentation performance, exceeding it by up to 2 percentage points. This underscores its accuracy, robustness, and excellent generalization capabilities.

arxiv情報

著者 Zhiqing Zhang,Tianyong Liu,Guojia Fan,Bin Li,Qianjin Feng,Shoujun Zhou
発行日 2024-08-28 15:59:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV パーマリンク