SegNetr: Rethinking the local-global interactions and skip connections in U-shaped networks

要約

最近、U 字型ネットワークは、その構造がシンプルで調整が容易なため、医療画像セグメンテーションの分野で主流となっています。
ただし、既存の U 字型セグメンテーション ネットワークは、1) 畳み込み演算に基づく長期依存性の欠如を補うための複雑なセルフ アテンション モジュールの設計に主に焦点を当てており、ネットワークの全体的なパラメータ数と計算の複雑さが増加します。
2) エンコーダとデコーダの空間的位置間の関係を無視して、エンコーダとデコーダの機能を単純に融合します。
この論文では、上記の問題を再考し、SegNetr と呼ばれる軽量の医療画像セグメンテーション ネットワークを構築します。
具体的には、ローカルとグローバルの相互作用をどの段階でも線形の複雑さのみで動的に実行できる新しい SegNetr ブロックを導入します。
同時に、エンコーダ機能の空間位置情報を保存し、デコーダ機能との正確な融合を実現するために、一般情報保持スキップ接続 (IRSC) を設計します。
私たちは、標準的な U-Net よりもパラメーターと GFLOP が 59\% および 76\% 少ない、最先端の方法に匹敵するセグメンテーション パフォーマンスを達成しながら、4 つの主流の医用画像セグメンテーション データセットに対する SegNetr の有効性を検証します。
特に、このホワイトペーパーで提案したコンポーネントは、他の U 字型ネットワークに適用して、セグメンテーションのパフォーマンスを向上させることができます。

要約(オリジナル)

Recently, U-shaped networks have dominated the field of medical image segmentation due to their simple and easily tuned structure. However, existing U-shaped segmentation networks: 1) mostly focus on designing complex self-attention modules to compensate for the lack of long-term dependence based on convolution operation, which increases the overall number of parameters and computational complexity of the network; 2) simply fuse the features of encoder and decoder, ignoring the connection between their spatial locations. In this paper, we rethink the above problem and build a lightweight medical image segmentation network, called SegNetr. Specifically, we introduce a novel SegNetr block that can perform local-global interactions dynamically at any stage and with only linear complexity. At the same time, we design a general information retention skip connection (IRSC) to preserve the spatial location information of encoder features and achieve accurate fusion with the decoder features. We validate the effectiveness of SegNetr on four mainstream medical image segmentation datasets, with 59\% and 76\% fewer parameters and GFLOPs than vanilla U-Net, while achieving segmentation performance comparable to state-of-the-art methods. Notably, the components proposed in this paper can be applied to other U-shaped networks to improve their segmentation performance.

arxiv情報

著者 Junlong Cheng,Chengrui Gao,Fengjie Wang,Min Zhu
発行日 2023-07-21 09:26:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク