DoubleU-NetPlus: A Novel Attention and Context Guided Dual U-Net with Multi-Scale Residual Feature Fusion Network for Semantic Segmentation of Medical Images

要約

医用画像の関心領域を正確にセグメンテーションすることは、生命を脅かす疾患の効果的な治療計画を考案するための重要な道筋を提供できます。
U-Net や、CE-Net や DoubleU-Net などの最先端のバリアントが、ネットワークの畳み込みユニットの高レベルの出力機能マップを効果的にモデル化することは、主に以下の理由により、依然として困難です。
関心領域のさまざまなスケールの存在、コンテキスト環境の複雑さ、あいまいな境界、および医療画像のテクスチャの多様性。
このホワイトペーパーでは、マルチコンテキスト機能といくつかの注意戦略を活用して、より正確な医療画像セグメンテーションのために識別機能表現をモデル化するネットワークの能力を高め、DoubleU-NetPlus という名前の新しいデュアル U-Net ベースのアーキテクチャを紹介します。
DoubleU-NetPlus には、いくつかのアーキテクチャ上の変更が組み込まれています。
特に、EfficientNetB7 を機能エンコーダー モジュールとして統合し、新しく設計されたマルチカーネル残差畳み込みモジュールと、アテンション ベースのアトラス空間ピラミッド プーリング モジュールを再調整する適応機能を統合して、差別的なマルチスケールの高レベルのコンテキストを漸進的かつ正確に蓄積します。
特徴マップを作成し、顕著な領域を強調します。
さらに、新しいトリプル アテンション ゲート モジュールとハイブリッド トリプル アテンション モジュールを導入して、関連する医療画像機能の選択的モデリングを促進します。
さらに、勾配消失の問題を軽減し、高解像度の特徴をより深い空間的詳細に組み込むために、標準の畳み込み演算は注意ガイド付きの残差畳み込み演算に置き換えられます…

要約(オリジナル)

Accurate segmentation of the region of interest in medical images can provide an essential pathway for devising effective treatment plans for life-threatening diseases. It is still challenging for U-Net, and its state-of-the-art variants, such as CE-Net and DoubleU-Net, to effectively model the higher-level output feature maps of the convolutional units of the network mostly due to the presence of various scales of the region of interest, intricacy of context environments, ambiguous boundaries, and multiformity of textures in medical images. In this paper, we exploit multi-contextual features and several attention strategies to increase networks’ ability to model discriminative feature representation for more accurate medical image segmentation, and we present a novel dual U-Net-based architecture named DoubleU-NetPlus. The DoubleU-NetPlus incorporates several architectural modifications. In particular, we integrate EfficientNetB7 as the feature encoder module, a newly designed multi-kernel residual convolution module, and an adaptive feature re-calibrating attention-based atrous spatial pyramid pooling module to progressively and precisely accumulate discriminative multi-scale high-level contextual feature maps and emphasize the salient regions. In addition, we introduce a novel triple attention gate module and a hybrid triple attention module to encourage selective modeling of relevant medical image features. Moreover, to mitigate the gradient vanishing issue and incorporate high-resolution features with deeper spatial details, the standard convolution operation is replaced with the attention-guided residual convolution operations, …

arxiv情報

著者 Md. Rayhan Ahmed,Adnan Ferdous Ashrafi,Raihan Uddin Ahmed,Swakkhar Shatabda,A. K. M. Muzahidul Islam,Salekul Islam
発行日 2022-11-25 16:56:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 92C55, cs.CV, eess.IV, I.4.6 パーマリンク