DiffPrompter: Differentiable Implicit Visual Prompts for Semantic-Segmentation in Adverse Conditions


悪天候シナリオにおけるセマンティック セグメンテーションは、自動運転システムにとって重要なタスクです。
基礎モデルにおける既存のアダプターの学習機能を拡張することを目的とした、新しい微分可能な視覚的および潜在的なプロンプト メカニズムである DiffPrompter を紹介します。
私たちが提案する $\nabla$HFC 画像処理ブロックは、従来の方法では不十分な場合が多い悪天候条件で特に優れています。
当社の差別化可能な視覚的プロンプトは、並列および直列のアーキテクチャを利用してプロンプトを生成し、悪条件下でのオブジェクトのセグメンテーション タスクを効果的に改善します。
プロジェクト ページ (https://diffprompter.github.io)。


Semantic segmentation in adverse weather scenarios is a critical task for autonomous driving systems. While foundation models have shown promise, the need for specialized adaptors becomes evident for handling more challenging scenarios. We introduce DiffPrompter, a novel differentiable visual and latent prompting mechanism aimed at expanding the learning capabilities of existing adaptors in foundation models. Our proposed $\nabla$HFC image processing block excels particularly in adverse weather conditions, where conventional methods often fall short. Furthermore, we investigate the advantages of jointly training visual and latent prompts, demonstrating that this combined approach significantly enhances performance in out-of-distribution scenarios. Our differentiable visual prompts leverage parallel and series architectures to generate prompts, effectively improving object segmentation tasks in adverse conditions. Through a comprehensive series of experiments and evaluations, we provide empirical evidence to support the efficacy of our approach. Project page at https://diffprompter.github.io.


著者 Sanket Kalwar,Mihir Ungarala,Shruti Jain,Aaron Monis,Krishna Reddy Konda,Sourav Garg,K Madhava Krishna
発行日 2024-03-27 02:51:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク