Rotate to Scan: UNet-like Mamba with Triplet SSM Module for Medical Image Segmentation

要約

画像セグメンテーションは、医療分野の診断と治療の分野で重要な位置を占めています。
従来の畳み込みニューラル ネットワーク (CNN) と Transformer モデルは、この分野で大幅な進歩を遂げてきましたが、受容野の制限や計算の複雑さのために依然として課題に直面しています。
最近、状態空間モデル (SSM)、特に Mamba とそのバリアントは、視覚分野で顕著なパフォーマンスを実証しました。
ただし、それらの特徴抽出方法は十分に効果的ではなく、冗長な構造が残っているため、パラメーターを削減する余地が残っています。
以前の空間およびチャネル注意法に動機付けられて、我々は Triplet Mamba-UNet を提案します。
この方法では、残留 VSS ブロックを活用して集中的なコンテキスト特徴を抽出し、トリプレット SSM を使用して空間次元およびチャネル次元全体の特徴を融合します。
ISIC17、ISIC18、CVC-300、CVC-ClinicDB、Kvasir-SEG、CVC-ColonDB、および Kvasir-Instrument データセットで実験を実施し、提案した TM-UNet の優れたセグメンテーション パフォーマンスを実証しました。
さらに、以前の VM-UNet と比較して、私たちのモデルはパラメータの 3 分の 1 の削減を達成しました。

要約(オリジナル)

Image segmentation holds a vital position in the realms of diagnosis and treatment within the medical domain. Traditional convolutional neural networks (CNNs) and Transformer models have made significant advancements in this realm, but they still encounter challenges because of limited receptive field or high computing complexity. Recently, State Space Models (SSMs), particularly Mamba and its variants, have demonstrated notable performance in the field of vision. However, their feature extraction methods may not be sufficiently effective and retain some redundant structures, leaving room for parameter reduction. Motivated by previous spatial and channel attention methods, we propose Triplet Mamba-UNet. The method leverages residual VSS Blocks to extract intensive contextual features, while Triplet SSM is employed to fuse features across spatial and channel dimensions. We conducted experiments on ISIC17, ISIC18, CVC-300, CVC-ClinicDB, Kvasir-SEG, CVC-ColonDB, and Kvasir-Instrument datasets, demonstrating the superior segmentation performance of our proposed TM-UNet. Additionally, compared to the previous VM-UNet, our model achieves a one-third reduction in parameters.

arxiv情報

著者 Hao Tang,Lianglun Cheng,Guoheng Huang,Zhengguang Tan,Junhao Lu,Kaihong Wu
発行日 2024-04-01 02:31:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク