CMUNeXt: An Efficient Medical Image Segmentation Network based on Large Kernel and Skip Fusion

要約

U字形アーキテクチャは、医用画像セグメンテーションネットワークの設計において重要なパラダイムとして登場した。しかし、畳み込み特有の局所的な制約により、U字型アーキテクチャーを持つ完全畳み込みセグメンテーションネットワークは、病変の正確な位置特定に不可欠なグローバルコンテキスト情報を効果的に抽出するのに苦労する。CNNとTransformerを組み合わせたハイブリッドアーキテクチャーはこれらの問題に対処できるが、環境やエッジデバイスによる計算リソースの制約のため、実際の医療シナリオへの応用は限られている。加えて、軽量ネットワークにおける畳み込み誘導バイアスは、Transformerベースのネットワークには欠けている、乏しい医療データに巧みに適合する。誘導バイアスを利用しながらグローバルなコンテキスト情報を抽出するために、我々はCMUNeXtを提案する。CMUNeXtは効率的な完全畳み込み軽量医用画像セグメンテーションネットワークであり、実シーンシナリオにおいて高速かつ正確な補助診断を可能にする。CMUNeXtは大きなカーネルと逆ボトルネック設計を利用して、遠くの空間情報と位置情報を徹底的に混合し、グローバルなコンテキスト情報を効率的に抽出する。また、スキップフュージョンブロックを導入し、スムーズなスキップ接続を可能にし、十分な特徴融合を保証するように設計されている。複数の医用画像データセットを用いた実験の結果、CMUNeXtは既存のヘビーウェイトおよびライトウェイト医用画像セグメンテーションネットワークをセグメンテーション性能の点で上回り、同時に推論速度の高速化、重みの軽量化、計算コストの削減を実現していることが実証された。コードはhttps://github.com/FengheTan9/CMUNeXt。

要約(オリジナル)

The U-shaped architecture has emerged as a crucial paradigm in the design of medical image segmentation networks. However, due to the inherent local limitations of convolution, a fully convolutional segmentation network with U-shaped architecture struggles to effectively extract global context information, which is vital for the precise localization of lesions. While hybrid architectures combining CNNs and Transformers can address these issues, their application in real medical scenarios is limited due to the computational resource constraints imposed by the environment and edge devices. In addition, the convolutional inductive bias in lightweight networks adeptly fits the scarce medical data, which is lacking in the Transformer based network. In order to extract global context information while taking advantage of the inductive bias, we propose CMUNeXt, an efficient fully convolutional lightweight medical image segmentation network, which enables fast and accurate auxiliary diagnosis in real scene scenarios. CMUNeXt leverages large kernel and inverted bottleneck design to thoroughly mix distant spatial and location information, efficiently extracting global context information. We also introduce the Skip-Fusion block, designed to enable smooth skip-connections and ensure ample feature fusion. Experimental results on multiple medical image datasets demonstrate that CMUNeXt outperforms existing heavyweight and lightweight medical image segmentation networks in terms of segmentation performance, while offering a faster inference speed, lighter weights, and a reduced computational cost. The code is available at https://github.com/FengheTan9/CMUNeXt.

arxiv情報

著者 Fenghe Tang,Jianrui Ding,Lingtao Wang,Chunping Ning,S. Kevin Zhou
発行日 2023-08-03 02:05:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, eess.IV, I.4.6 パーマリンク