要約
畳み込みニューラル ネットワーク (CNN) の急成長に伴い、VGG-16 や ResNet-50 などの CNN は、SAR 船舶検出のバックボーンとして広く機能しています。
ただし、CNN ベースのバックボーンは、長距離の依存関係をモデル化するのが難しく、浅いレイヤーの特徴マップで十分な高品質のセマンティック情報が不足する原因となり、複雑な背景や小型船のケースでは検出性能が低下します。
これらの問題に対処するために、Swin Transformer と Feature Enhancement Feature Pyramid Network (FEFPN) に基づく SAR 船舶検出方法を提案します。
Swin Transformer は、長期的な依存関係をモデル化するバックボーンとして機能し、階層的な機能マップを生成します。
FEFPN は、すべてのレベル、特に浅いレイヤーの特徴マップのセマンティック情報を徐々に強化することにより、特徴マップの品質をさらに向上させるために提案されています。
SAR 船舶検出データセット (SSDD) で実施された実験により、提案された方法の利点が明らかになりました。
要約(オリジナル)
With the booming of Convolutional Neural Networks (CNNs), CNNs such as VGG-16 and ResNet-50 widely serve as backbone in SAR ship detection. However, CNN based backbone is hard to model long-range dependencies, and causes the lack of enough high-quality semantic information in feature maps of shallow layers, which leads to poor detection performance in complicated background and small-sized ships cases. To address these problems, we propose a SAR ship detection method based on Swin Transformer and Feature Enhancement Feature Pyramid Network (FEFPN). Swin Transformer serves as backbone to model long-range dependencies and generates hierarchical features maps. FEFPN is proposed to further improve the quality of feature maps by gradually enhancing the semantic information of feature maps at all levels, especially feature maps in shallow layers. Experiments conducted on SAR ship detection dataset (SSDD) reveal the advantage of our proposed methods.
arxiv情報
著者 | Xiao Ke,Xiaoling Zhang,Tianwen Zhang,Jun Shi,Shunjun Wei |
発行日 | 2022-09-21 15:12:50+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google