Hunting Attributes: Context Prototype-Aware Learning for Weakly Supervised Semantic Segmentation


最近の弱教師セマンティック セグメンテーション (WSSS) 手法は、コンテキスト知識を組み込んでクラス アクティベーション マップ (CAM) の完全性を向上させることに努めています。
この仮説は、この知識バイアスにより、コンテキスト プロトタイプが類似した頻繁に共起するオブジェクト カテゴリを誤ってアクティブ化する可能性があるというものです。
この目標を達成するために、意味論的なコンテキストを活用してインスタンスの理解を強化するコンテキスト プロトタイプ認識学習 (CPAL) 戦略を提案します。
さらに、ラベルに基づく分類監視とプロトタイプに基づく自己監視を組み合わせる統合トレーニング フレームワークが提案されています。
PASCAL VOC 2012 および MS COCO 2014 の実験結果は、CPAL が既製の手法を大幅に改善し、最先端のパフォーマンスを達成することを示しています。
プロジェクトは で入手できます。


Recent weakly supervised semantic segmentation (WSSS) methods strive to incorporate contextual knowledge to improve the completeness of class activation maps (CAM). In this work, we argue that the knowledge bias between instances and contexts affects the capability of the prototype to sufficiently understand instance semantics. Inspired by prototype learning theory, we propose leveraging prototype awareness to capture diverse and fine-grained feature attributes of instances. The hypothesis is that contextual prototypes might erroneously activate similar and frequently co-occurring object categories due to this knowledge bias. Therefore, we propose to enhance the prototype representation ability by mitigating the bias to better capture spatial coverage in semantic object regions. With this goal, we present a Context Prototype-Aware Learning (CPAL) strategy, which leverages semantic context to enrich instance comprehension. The core of this method is to accurately capture intra-class variations in object features through context-aware prototypes, facilitating the adaptation to the semantic attributes of various instances. We design feature distribution alignment to optimize prototype awareness, aligning instance feature distributions with dense features. In addition, a unified training framework is proposed to combine label-guided classification supervision and prototypes-guided self-supervision. Experimental results on PASCAL VOC 2012 and MS COCO 2014 show that CPAL significantly improves off-the-shelf methods and achieves state-of-the-art performance. The project is available at


著者 Feilong Tang,Zhongxing Xu,Zhaojun Qu,Wei Feng,Xingjian Jiang,Zongyuan Ge
発行日 2024-03-12 13:11:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.CV パーマリンク