A Weakly Supervised Learning Framework for Salient Object Detection via Hybrid Labels

要約

完全教師あり物体検出(SOD)手法は大きな進歩を遂げているが、そのような手法はしばしば、時間と労力がかかる多数のピクセルレベルのアノテーションに依存している。本論文では、ハイブリッドラベルの下での新しい弱教師付きSODタスクに注目する。ここで、監督ラベルは従来の教師なし法によって生成された多数の粗ラベルと少数の実ラベルを含んでいる。このタスクにおけるラベルノイズと量の不均衡の問題に対処するため、我々は3つの洗練された学習戦略を持つ新しいパイプラインフレームワークを設計する。モデルフレームワークの面では、タスクをラベル洗練サブタスクと顕著な物体検出サブタスクに切り離し、互いに協力しながら交互に学習させる。具体的には、R-NetはBlender with Guidance and Aggregation Mechanisms(BGA)を備えた2ストリームエンコーダデコーダモデルとして設計され、粗いラベルをより信頼できる擬似ラベルに修正することを目的とし、S-Netは現在のR-Netが生成した擬似ラベルによって監視される置換可能なSODネットワークである。なお、テストには学習済みのS-Netを使用すればよい。さらに、ネットワーク学習の有効性と効率性を保証するために、代替反復機構、グループ単位の漸増機構、信頼性検証機構の3つの学習戦略を設計する。5つのSODベンチマークを用いた実験により、本手法が弱教師付き/教師なし手法に対して質的にも量的にも競争力のある性能を達成することが示された。

要約(オリジナル)

Fully-supervised salient object detection (SOD) methods have made great progress, but such methods often rely on a large number of pixel-level annotations, which are time-consuming and labour-intensive. In this paper, we focus on a new weakly-supervised SOD task under hybrid labels, where the supervision labels include a large number of coarse labels generated by the traditional unsupervised method and a small number of real labels. To address the issues of label noise and quantity imbalance in this task, we design a new pipeline framework with three sophisticated training strategies. In terms of model framework, we decouple the task into label refinement sub-task and salient object detection sub-task, which cooperate with each other and train alternately. Specifically, the R-Net is designed as a two-stream encoder-decoder model equipped with Blender with Guidance and Aggregation Mechanisms (BGA), aiming to rectify the coarse labels for more reliable pseudo-labels, while the S-Net is a replaceable SOD network supervised by the pseudo labels generated by the current R-Net. Note that, we only need to use the trained S-Net for testing. Moreover, in order to guarantee the effectiveness and efficiency of network training, we design three training strategies, including alternate iteration mechanism, group-wise incremental mechanism, and credibility verification mechanism. Experiments on five SOD benchmarks show that our method achieves competitive performance against weakly-supervised/unsupervised methods both qualitatively and quantitatively.

arxiv情報

著者 Runmin Cong,Qi Qin,Chen Zhang,Qiuping Jiang,Shiqi Wang,Yao Zhao,Sam Kwong
発行日 2022-09-07 06:45:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク