要約
カモフラージュオブジェクト検出(COD)は、ターゲットとその背景の微妙な視覚的な違いにより、固有の課題を提示します。
既存の方法は顕著な進歩を遂げていますが、まだ完全に調査されていない後処理洗練の重要な可能性が残っています。
この制限に対処するために、COD向けに特別に設計された最初の生成洗練フレームワークである不確実なマスクされたBernoulli拡散(UMBD)モデルを提案します。
UMBDは、セグメンテーションの品質が低い残留領域にベルヌーリ拡散を選択的に適用する不確実性ガイド付きマスキングメカニズムを導入し、ターゲットを絞った洗練を、正しくセグメント化された領域を保存しながら可能にします。
このプロセスをサポートするために、マルチブランチアーキテクチャを採用し、複数のソースから不確実性を融合させて推定精度を向上させるハイブリッド不確実性定量化ネットワーク(HUQNET)を設計します。
これにより、生成サンプリングプロセス中に適応ガイダンスが可能になります。
提案されているUMBDフレームワークは、幅広い既存のエンコーダーデコーダーベースのCODモデルとシームレスに統合でき、その識別機能と拡散ベースの改良の生成的利点を組み合わせています。
複数のCODベンチマークにわたる広範な実験は、一貫したパフォーマンスの改善を示しており、MAEで5.5%の平均増加と、控えめな計算オーバーヘッドのみで加重Fメジャーで3.2%を達成します。
コードがリリースされます。
要約(オリジナル)
Camouflaged Object Detection (COD) presents inherent challenges due to the subtle visual differences between targets and their backgrounds. While existing methods have made notable progress, there remains significant potential for post-processing refinement that has yet to be fully explored. To address this limitation, we propose the Uncertainty-Masked Bernoulli Diffusion (UMBD) model, the first generative refinement framework specifically designed for COD. UMBD introduces an uncertainty-guided masking mechanism that selectively applies Bernoulli diffusion to residual regions with poor segmentation quality, enabling targeted refinement while preserving correctly segmented areas. To support this process, we design the Hybrid Uncertainty Quantification Network (HUQNet), which employs a multi-branch architecture and fuses uncertainty from multiple sources to improve estimation accuracy. This enables adaptive guidance during the generative sampling process. The proposed UMBD framework can be seamlessly integrated with a wide range of existing Encoder-Decoder-based COD models, combining their discriminative capabilities with the generative advantages of diffusion-based refinement. Extensive experiments across multiple COD benchmarks demonstrate consistent performance improvements, achieving average gains of 5.5% in MAE and 3.2% in weighted F-measure with only modest computational overhead. Code will be released.
arxiv情報
著者 | Yuqi Shen,Fengyang Xiao,Sujie Hu,Youwei Pang,Yifan Pu,Chengyu Fang,Xiu Li,Chunming He |
発行日 | 2025-06-12 14:02:18+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google