FANet: Feature Amplification Network for Semantic Segmentation in Cluttered Background

要約

既存の深層学習アプローチでは、乱雑な背景や半透明のオブジェクトなどを含む複雑なシナリオに存在するセマンティック セグメンテーションに重要なセマンティック キューが省略されています。これらの課題に対処するために、セマンティック情報を組み込んだバックボーン ネットワークとして特徴増幅ネットワーク (FANet) を提案します。
新しい機能拡張モジュールを多段階で使用します。
これを達成するために、空間コンテキスト モジュール (SCM) と特徴改良モジュール (FRM) の両方を並行して活用する適応機能拡張 (AFE) ブロックを提案します。
SCM は、シーン内のスケールの変化に対処するために、受容野の増加に対してより大きなカーネル レバレッジを活用することを目的としています。
一方、私たちの新しいFRMは、より適切なセグメンテーションタスクのために低周波領域と高周波領域の両方をキャプチャできるセマンティックキューを生成する役割を果たします。
私たちは、背景が乱雑で半透明のオブジェクトを含む、困難な現実世界の ZeroWaste-f データセットに対して実験を実行します。
私たちの実験結果は、既存の方法と比較して最先端のパフォーマンスを示しています。

要約(オリジナル)

Existing deep learning approaches leave out the semantic cues that are crucial in semantic segmentation present in complex scenarios including cluttered backgrounds and translucent objects, etc. To handle these challenges, we propose a feature amplification network (FANet) as a backbone network that incorporates semantic information using a novel feature enhancement module at multi-stages. To achieve this, we propose an adaptive feature enhancement (AFE) block that benefits from both a spatial context module (SCM) and a feature refinement module (FRM) in a parallel fashion. SCM aims to exploit larger kernel leverages for the increased receptive field to handle scale variations in the scene. Whereas our novel FRM is responsible for generating semantic cues that can capture both low-frequency and high-frequency regions for better segmentation tasks. We perform experiments over challenging real-world ZeroWaste-f dataset which contains background-cluttered and translucent objects. Our experimental results demonstrate the state-of-the-art performance compared to existing methods.

arxiv情報

著者 Muhammad Ali,Mamoona Javaid,Mubashir Noman,Mustansar Fiaz,Salman Khan
発行日 2024-07-12 15:57:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク