Texture-guided Saliency Distilling for Unsupervised Salient Object Detection

要約

ディープラーニングに基づく教師なしサリエントオブジェクト検出(USOD)は、主に従来の手作業や事前に訓練されたネットワークから生成されたノイズの多いサリエンシー疑似ラベルに依存している。ノイジーなラベルの問題に対処するために、一群の手法は信頼できるラベルを持つ簡単なサンプルだけに焦点を当て、難しいサンプルの貴重な知識を無視する。本論文では、簡単なサンプルと硬いサンプルの両方から、豊富で正確な顕著性知識を掘り起こす新しいUSOD手法を提案する。まず、サンプルの信頼度を条件としたスコアリングを行う信頼度考慮型顕著性抽出(CSD)戦略を提案し、これによりモデルが顕著性知識を簡単なサンプルから難しいサンプルへと段階的に抽出するようガイドする。第二に、予測された境界の周りのテクスチャをマッチングすることにより、ノイズの多いラベルの境界を洗練する境界認識テクスチャマッチング(BTM)戦略を提案する。RGB、RGB-D、RGB-T、ビデオSODベンチマークに対する広範な実験により、我々の方法が最先端のUSOD性能を達成することが証明された。

要約(オリジナル)

Deep Learning-based Unsupervised Salient Object Detection (USOD) mainly relies on the noisy saliency pseudo labels that have been generated from traditional handcraft methods or pre-trained networks. To cope with the noisy labels problem, a class of methods focus on only easy samples with reliable labels but ignore valuable knowledge in hard samples. In this paper, we propose a novel USOD method to mine rich and accurate saliency knowledge from both easy and hard samples. First, we propose a Confidence-aware Saliency Distilling (CSD) strategy that scores samples conditioned on samples’ confidences, which guides the model to distill saliency knowledge from easy samples to hard samples progressively. Second, we propose a Boundary-aware Texture Matching (BTM) strategy to refine the boundaries of noisy labels by matching the textures around the predicted boundary. Extensive experiments on RGB, RGB-D, RGB-T, and video SOD benchmarks prove that our method achieves state-of-the-art USOD performance.

arxiv情報

著者 Huajun Zhou,Bo Qiao,Lingxiao Yang,Jianhuang Lai,Xiaohua Xie
発行日 2023-03-06 10:11:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク