FANet: Feature Amplification Network for Semantic Segmentation in Cluttered Background


既存の深層学習アプローチでは、乱雑な背景や半透明のオブジェクトなどを含む複雑なシナリオに存在するセマンティック セグメンテーションに重要なセマンティック キューが省略されています。これらの課題に対処するために、セマンティック情報を組み込んだバックボーン ネットワークとして特徴増幅ネットワーク (FANet) を提案します。
これを達成するために、空間コンテキスト モジュール (SCM) と特徴改良モジュール (FRM) の両方を並行して活用する適応機能拡張 (AFE) ブロックを提案します。
SCM は、シーン内のスケールの変化に対処するために、受容野の増加に対してより大きなカーネル レバレッジを活用することを目的としています。
私たちは、背景が乱雑で半透明のオブジェクトを含む、困難な現実世界の ZeroWaste-f データセットに対して実験を実行します。


Existing deep learning approaches leave out the semantic cues that are crucial in semantic segmentation present in complex scenarios including cluttered backgrounds and translucent objects, etc. To handle these challenges, we propose a feature amplification network (FANet) as a backbone network that incorporates semantic information using a novel feature enhancement module at multi-stages. To achieve this, we propose an adaptive feature enhancement (AFE) block that benefits from both a spatial context module (SCM) and a feature refinement module (FRM) in a parallel fashion. SCM aims to exploit larger kernel leverages for the increased receptive field to handle scale variations in the scene. Whereas our novel FRM is responsible for generating semantic cues that can capture both low-frequency and high-frequency regions for better segmentation tasks. We perform experiments over challenging real-world ZeroWaste-f dataset which contains background-cluttered and translucent objects. Our experimental results demonstrate the state-of-the-art performance compared to existing methods.


著者 Muhammad Ali,Mamoona Javaid,Mubashir Noman,Mustansar Fiaz,Salman Khan
発行日 2024-07-12 15:57:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CV パーマリンク