PAM-UNet: Shifting Attention on Region of Interest in Medical Images

要約

コンピュータ支援セグメンテーション手法は、医療従事者が診断結果を向上させるのに役立ちます。
UNet やその亜種のような最近の進歩は有望である一方で、精度と計算効率のバランスという重要な課題に直面しています。
UNets の浅いエンコーダ アーキテクチャは、重要な空間特徴を捕捉するのに苦労することが多く、不正確でまばらなセグメンテーションが発生します。
この制限に対処するために、新しい \underline{P}rogressive \underline{A}ttention based \underline{M}obile \underline{UNet} (\underline{PAM-UNet}) アーキテクチャを提案します。
PAM-UNet の反転残差 (IR) ブロックは軽量フレームワークの維持に役立ちますが、層ごとの \textit{Progressive Luong Attendance} ($\mathcal{PLA}$) は、合成中に関心のある領域に注意を向けることによって正確なセグメンテーションを促進します。
私たちのアプローチは精度と速度の両方を優先しており、肝臓腫瘍セグメンテーション ベンチマーク (LiTS) 2017 データセットで必要な浮動小数点演算数は 1.32 回/秒 (FLOPS) のみでありながら、平均 IoU 74.65 とサイコロ スコア 82.87 という優れたバランスを達成しています。
これらの結果は、臨床現場での AI の導入を加速するために効率的なセグメンテーション モデルを開発することの重要性を浮き彫りにしています。

要約(オリジナル)

Computer-aided segmentation methods can assist medical personnel in improving diagnostic outcomes. While recent advancements like UNet and its variants have shown promise, they face a critical challenge: balancing accuracy with computational efficiency. Shallow encoder architectures in UNets often struggle to capture crucial spatial features, leading in inaccurate and sparse segmentation. To address this limitation, we propose a novel \underline{P}rogressive \underline{A}ttention based \underline{M}obile \underline{UNet} (\underline{PAM-UNet}) architecture. The inverted residual (IR) blocks in PAM-UNet help maintain a lightweight framework, while layerwise \textit{Progressive Luong Attention} ($\mathcal{PLA}$) promotes precise segmentation by directing attention toward regions of interest during synthesis. Our approach prioritizes both accuracy and speed, achieving a commendable balance with a mean IoU of 74.65 and a dice score of 82.87, while requiring only 1.32 floating-point operations per second (FLOPS) on the Liver Tumor Segmentation Benchmark (LiTS) 2017 dataset. These results highlight the importance of developing efficient segmentation models to accelerate the adoption of AI in clinical practice.

arxiv情報

著者 Abhijit Das,Debesh Jha,Vandan Gorade,Koushik Biswas,Hongyi Pan,Zheyuan Zhang,Daniela P. Ladner,Yury Velichko,Amir Borhani,Ulas Bagci
発行日 2024-05-02 17:33:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV パーマリンク