IBoxCLA: Towards Robust Box-supervised Segmentation of Polyp via Improved Box-dice and Contrastive Latent-anchors

要約

ボックス監視付きポリープ セグメンテーションは、その費用対効果の高い可能性によりますます注目を集めています。
既存のソリューションは多くの場合、学習不要の手法や事前トレーニングされたモデルに依存して、擬似マスクを苦労して生成し、その後 Dice 制約をトリガーします。
この論文では、最も単純なボックスで満たされたマスクによってガイドされたモデルは、ポリープの位置/サイズを正確に予測できますが、形状が崩れるという問題があることがわかりました。
これに応えて、改良型ボックスダイス (IBox) と対照的潜在アンカー (CLA) という 2 つの革新的な学習方法を提案し、それらを組み合わせて堅牢なボックス教師ありモデル IBoxCLA をトレーニングします。
IBoxCLA の背後にある中心的なアイデアは、位置/サイズと形状の学習を分離し、それぞれに焦点を当てた制約を可能にすることです。
具体的には、IBox は、形状デカップリングと混乱領域スワッピングを順番に使用して、セグメンテーション マップをプロキシ マップに変換します。
プロキシ マップ内では、形状は解きほぐされ、位置/サイズはボックス状の応答としてエンコードされます。
生の予測の代わりにプロキシ マップを制約することにより、ボックスで満たされたマスクは形状学習を誤解させることなく IBoxCLA を適切に監視できます。
さらに、CLA は 2 種類の潜在アンカーを生成することで形状学習に貢献します。潜在アンカーは運動量とセグメント化されたポリープを使用して学習および更新され、ポリープと背景の特徴を着実に表現します。
潜在アンカーにより、IBoxCLA はボックス内外の識別特徴を対照的な方法で捕捉し、より明確な境界を生成することが容易になります。
5 つの公開ポリープ データセットで IBoxCLA のベンチマークを行います。
実験結果は、最近の完全監視型ポリープセグメンテーション法と比較した IBoxCLA の競合パフォーマンスと、全体の mDice と mIoU が少なくとも 6.5% および 7.5% 増加するという、他のボックス監視型の最先端技術に対する IBoxCLA の優位性を示しています。
%、 それぞれ。

要約(オリジナル)

Box-supervised polyp segmentation attracts increasing attention for its cost-effective potential. Existing solutions often rely on learning-free methods or pretrained models to laboriously generate pseudo masks, triggering Dice constraint subsequently. In this paper, we found that a model guided by the simplest box-filled masks can accurately predict polyp locations/sizes, but suffers from shape collapsing. In response, we propose two innovative learning fashions, Improved Box-dice (IBox) and Contrastive Latent-Anchors (CLA), and combine them to train a robust box-supervised model IBoxCLA. The core idea behind IBoxCLA is to decouple the learning of location/size and shape, allowing for focused constraints on each of them. Specifically, IBox transforms the segmentation map into a proxy map using shape decoupling and confusion-region swapping sequentially. Within the proxy map, shapes are disentangled, while locations/sizes are encoded as box-like responses. By constraining the proxy map instead of the raw prediction, the box-filled mask can well supervise IBoxCLA without misleading its shape learning. Furthermore, CLA contributes to shape learning by generating two types of latent anchors, which are learned and updated using momentum and segmented polyps to steadily represent polyp and background features. The latent anchors facilitate IBoxCLA to capture discriminative features within and outside boxes in a contrastive manner, yielding clearer boundaries. We benchmark IBoxCLA on five public polyp datasets. The experimental results demonstrate the competitive performance of IBoxCLA compared to recent fully-supervised polyp segmentation methods, and its superiority over other box-supervised state-of-the-arts with a relative increase of overall mDice and mIoU by at least 6.5% and 7.5%, respectively.

arxiv情報

著者 Zhiwei Wang,Qiang Hu,Hongkuan Shi,Li He,Man He,Wenxuan Dai,Yinjiao Tian,Xin Yang,Mei Liu,Qiang Li
発行日 2024-09-13 15:06:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク