要約
病変のセグメンテーションには、速度と精度の両方が必要です。
この論文では、トランスフォーマーに基づくエンコーダーと、3 つのデュアル ストリーム アテンション (DSA) モジュールを含む畳み込みニューラル ネットワーク (CNN) ベースの異なるピラミッド デコーダーで構成される、シンプルでありながら効率的なネットワーク DSNet を提案します。
具体的には、DSA モジュールは、偽陽性のストリーム アテンション (FPSA) ブランチと偽陰性のストリーム アテンション (FNSA) ブランチを介して 2 つの隣接するレベルの機能を融合し、多様なコンテキスト情報を持つ機能を取得します。
CVC-ClinicDB、Kvasir-SEG、および ISIC-2018 タスク 1 を含むいくつかの公開データセットを使用して、さまざまな最先端 (SOTA) 病変セグメンテーション法と私たちの方法を比較します。実験結果は、私たちの方法が SOTA パフォーマンスを達成することを示しています。
平均ダイス係数 (mDice) と平均交差オーバー ユニオン (mIoU) に関して、モデルの複雑さとメモリ消費が少なくなります。
要約(オリジナル)
Lesion segmentation requires both speed and accuracy. In this paper, we propose a simple yet efficient network DSNet, which consists of a encoder based on Transformer and a convolutional neural network(CNN)-based distinct pyramid decoder containing three dual-stream attention (DSA) modules. Specifically, the DSA module fuses features from two adjacent levels through the false positive stream attention (FPSA) branch and the false negative stream attention (FNSA) branch to obtain features with diversified contextual information. We compare our method with various state-of-the-art (SOTA) lesion segmentation methods with several public datasets, including CVC-ClinicDB, Kvasir-SEG, and ISIC-2018 Task 1. The experimental results show that our method achieves SOTA performance in terms of mean Dice coefficient (mDice) and mean Intersection over Union (mIoU) with low model complexity and memory consumption.
arxiv情報
著者 | Yunxiao Liu |
発行日 | 2022-11-30 12:48:17+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google