Meta-Polyp: a baseline for efficient Polyp segmentation

要約

近年、ポリープのセグメンテーションが非常に重要になってきており、競争力のある結果を達成するために、CNN、Vision Transformer、および Transformer 技術を使用した多くの方法が開発されています。
ただし、これらの方法は、分布外のデータセット、境界の欠落、小さなポリープを処理するときに困難に直面することがよくあります。
2022 年に、Meta-Former がビジョンの新しいベースラインとして導入されました。これにより、マルチタスク コンピューター ビジョンのパフォーマンスが向上しただけでなく、Vision Transformer および CNN ファミリ バックボーンの制限にも対処されました。
セグメンテーションをさらに強化するために、テクスチャを強化するためにデコーダー段階でレベルアップの組み合わせを備えたマルチスケール アップサンプリング ブロックの導入とともに、Meta-Former と UNet の融合を提案します。また、それに基づく Convformer ブロックも提案します。
局所特徴の重要な情報を強化するメタフォーマーのアイデア。
これらのブロックにより、ポリープの全体的な形状などのグローバル情報と、医療セグメンテーションの決定に重要なローカル情報および境界情報との組み合わせが可能になります。
私たちが提案したアプローチは競争力のあるパフォーマンスを達成し、CVC-300 データセット、Kvasir、CVC-ColonDB データセットの最先端技術で最高の結果を獲得しました。
Kvasir-SEG 以外のデータセットは配布外のデータセットです。
実装は https://github.com/huyquoctrinh/MetaPolyp-CBMS2023 で見つけることができます。

要約(オリジナル)

In recent years, polyp segmentation has gained significant importance, and many methods have been developed using CNN, Vision Transformer, and Transformer techniques to achieve competitive results. However, these methods often face difficulties when dealing with out-of-distribution datasets, missing boundaries, and small polyps. In 2022, Meta-Former was introduced as a new baseline for vision, which not only improved the performance of multi-task computer vision but also addressed the limitations of the Vision Transformer and CNN family backbones. To further enhance segmentation, we propose a fusion of Meta-Former with UNet, along with the introduction of a Multi-scale Upsampling block with a level-up combination in the decoder stage to enhance the texture, also we propose the Convformer block base on the idea of the Meta-former to enhance the crucial information of the local feature. These blocks enable the combination of global information, such as the overall shape of the polyp, with local information and boundary information, which is crucial for the decision of the medical segmentation. Our proposed approach achieved competitive performance and obtained the top result in the State of the Art on the CVC-300 dataset, Kvasir, and CVC-ColonDB dataset. Apart from Kvasir-SEG, others are out-of-distribution datasets. The implementation can be found at: https://github.com/huyquoctrinh/MetaPolyp-CBMS2023.

arxiv情報

著者 Quoc-Huy Trinh
発行日 2023-07-18 13:13:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク