STM-UNet: An Efficient U-shaped Architecture Based on Swin Transformer and Multi-scale MLP for Medical Image Segmentation

要約

タイトル:Swin TransformerとマルチスケールMLPに基づく効率的なU字型アーキテクチャであるSTM-UNet:医療画像セグメンテーションのための

要約:
– 医療画像セグメンテーションの自動化は、医師がより早く正確に診断するのを支援することができます。
– 医療画像セグメンテーションのディープラーニングベースのモデルは、近年大きな進歩を遂げています。
– しかし、既存のモデルは、効果的にTransformerとMLPを利用してU字型アーキテクチャを効率的に改善することができません。
– さらに、MLPのマルチスケール機能は、U字型アーキテクチャのボトルネックで十分に抽出されていません。
– 本論文では、Swin TransformerとマルチスケールMLPに基づく効率的なU字型アーキテクチャであるSTM-UNetを提案しています。
– 特に、Swin Transformerブロックは、残留接続の形式でSTM-UNetに追加され、グローバル機能と長距離依存関係のモデリング能力を強化することができます。
– 同時に、新しいパラレル畳み込みモジュールが含まれたPCAS-MLPをアーキテクチャのボトルネックに配置して、セグメンテーション性能の向上に貢献するように設計されています。
– ISIC 2016およびISIC 2018の実験結果は、提案手法の有効性を示しています。また、IoUとDiceの観点から、いくつかの最先端の方法を上回っています。提案手法は、高いセグメンテーション精度と低いモデル複雑性の間のより良いトレードオフを実現しています。

要約(オリジナル)

Automated medical image segmentation can assist doctors to diagnose faster and more accurate. Deep learning based models for medical image segmentation have made great progress in recent years. However, the existing models fail to effectively leverage Transformer and MLP for improving U-shaped architecture efficiently. In addition, the multi-scale features of the MLP have not been fully extracted in the bottleneck of U-shaped architecture. In this paper, we propose an efficient U-shaped architecture based on Swin Transformer and multi-scale MLP, namely STM-UNet. Specifically, the Swin Transformer block is added to skip connection of STM-UNet in form of residual connection, which can enhance the modeling ability of global features and long-range dependency. Meanwhile, a novel PCAS-MLP with parallel convolution module is designed and placed into the bottleneck of our architecture to contribute to the improvement of segmentation performance. The experimental results on ISIC 2016 and ISIC 2018 demonstrate the effectiveness of our proposed method. Our method also outperforms several state-of-the-art methods in terms of IoU and Dice. Our method has achieved a better trade-off between high segmentation accuracy and low model complexity.

arxiv情報

著者 Lei Shi,Tianyu Gao,Zheng Zhang,Junxing Zhang
発行日 2023-04-25 07:18:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CV, eess.IV パーマリンク