CGCOD: Class-Guided Camouflaged Object Detection

要約

カモフラージュオブジェクト検出 (COD) は、周囲にシームレスに溶け込むオブジェクトを識別することを目的としています。
背景とのコントラストの低さ、多様なテクスチャ、微妙な外観の変化など、カモフラージュされたオブジェクトに固有の視覚的な複雑さにより、多くの場合、意味論的な手がかりが曖昧になり、正確なセグメンテーションが非常に困難になります。
既存の方法は主に視覚的特徴に依存していますが、カモフラージュされたオブジェクトの変動性と複雑さを処理するには不十分であり、オブジェクトの認識が不安定になり、セグメンテーションの結果があいまいになります。
これらの制限に対処するために、クラスガイドによる偽装オブジェクト検出 (CGCOD) という新しいタスクを導入します。これは、オブジェクト固有のクラス知識を組み込むことで従来の COD タスクを拡張し、検出の堅牢性と精度を強化します。
このタスクを容易にするために、クラス アノテーションを持つ現実世界のカモフラージュされたオブジェクトで構成される新しいデータセット CamoClass を紹介します。
さらに、プラグアンドプレイのクラス プロンプト ジェネレーターとシンプルかつ効果的なクラスガイド検出器を組み込んだ多段階フレームワーク CGNet を提案します。
これにより、COD の新しいパラダイムが確立され、コンテキストの理解とクラスに基づく検出の間のギャップが埋められます。
広範な実験結果は、クラスレベルのテキスト情報を活用することで、提案された検出器と既存の検出器のパフォーマンスを向上させる柔軟なフレームワークの有効性を示しています。

要約(オリジナル)

Camouflaged Object Detection (COD) aims to identify objects that blend seamlessly into their surroundings. The inherent visual complexity of camouflaged objects, including their low contrast with the background, diverse textures, and subtle appearance variations, often obscures semantic cues, making accurate segmentation highly challenging. Existing methods primarily rely on visual features, which are insufficient to handle the variability and intricacy of camouflaged objects, leading to unstable object perception and ambiguous segmentation results. To tackle these limitations, we introduce a novel task, class-guided camouflaged object detection (CGCOD), which extends traditional COD task by incorporating object-specific class knowledge to enhance detection robustness and accuracy. To facilitate this task, we present a new dataset, CamoClass, comprising real-world camouflaged objects with class annotations. Furthermore, we propose a multi-stage framework, CGNet, which incorporates a plug-and-play class prompt generator and a simple yet effective class-guided detector. This establishes a new paradigm for COD, bridging the gap between contextual understanding and class-guided detection. Extensive experimental results demonstrate the effectiveness of our flexible framework in improving the performance of proposed and existing detectors by leveraging class-level textual information.

arxiv情報

著者 Chenxi Zhang,Qing Zhang,Jiayun Wu,Youwei Pang
発行日 2025-01-15 15:22:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク