SvANet: A Scale-variant Attention-based Network for Small Medical Object Segmentation


畳み込みニューラル ネットワーク (CNN) などの深層学習アルゴリズムは、自然物や医療オブジェクトのセグメント化に使用され、有望な結果を示しています。
しかし、画像内の小さな領域の医療対象物を分析することは、CNN の畳み込みとプーリング操作によって引き起こされる情報損失と圧縮欠陥のため、依然として課題が残っています。
これらの課題に対処するために、医療画像内の小規模オブジェクトを正確にセグメンテーションするための新しいスケールバリアント アテンションベース ネットワーク (SvANet) を提案します。
SvANet は、モンテカルロ アテンション、スケールバリアント アテンション、およびビジョン トランスフォーマーで構成されます。ビジョン トランスフォーマーは、クロススケール機能を組み込んで圧縮アーティファクトを軽減し、小さな医療対象物の識別を強化します。
定量的な実験結果は、腎臓腫瘍、皮膚病変、肝臓腫瘍、ポリープ、外科手術のセグメント化において平均 Dice 係数で 96.12%、96.11%、89.79%、84.15%、80.25%、73.05%、72.58% を達成するという、SvANet の優れたパフォーマンスを示しています。
切除細胞、網膜血管系、精子。それぞれ、KiTS23、ISIC 2018、ATLAS、PolypGen、TissueNet、FIVES、SpermHealth データセットの画像領域の 1% 未満を占めています。


Early detection and accurate diagnosis can predict the risk of malignant disease transformation, thereby increasing the probability of effective treatment. A mild syndrome with small infected regions is an ominous warning and is foremost in the early diagnosis of diseases. Deep learning algorithms, such as convolutional neural networks (CNNs), have been used to segment natural or medical objects, showing promising results. However, analyzing medical objects of small areas in images remains a challenge due to information losses and compression defects caused by convolution and pooling operations in CNNs. These losses and defects become increasingly significant as the network deepens, particularly for small medical objects. To address these challenges, we propose a novel scale-variant attention-based network (SvANet) for accurate small-scale object segmentation in medical images. The SvANet consists of Monte Carlo attention, scale-variant attention, and vision transformer, which incorporates cross-scale features and alleviates compression artifacts for enhancing the discrimination of small medical objects. Quantitative experimental results demonstrate the superior performance of SvANet, achieving 96.12%, 96.11%, 89.79%, 84.15%, 80.25%, 73.05%, and 72.58% in mean Dice coefficient for segmenting kidney tumors, skin lesions, hepatic tumors, polyps, surgical excision cells, retinal vasculatures, and sperms, which occupy less than 1% of the image areas in KiTS23, ISIC 2018, ATLAS, PolypGen, TissueNet, FIVES, and SpermHealth datasets, respectively.


著者 Wei Dai
発行日 2024-07-10 14:53:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CV, eess.IV パーマリンク