Enhanced Multi-level Features for Very High Resolution Remote Sensing Scene Classification

要約

超高解像度(VHR)リモートセンシング(RS)シーン分類は、高いクラス間類似性とクラス内変動性の問題のため、困難なタスクである。近年、既存の深層学習(DL)ベースの手法は、VHR RSシーン分類において大きな可能性を示している。しかしながら、これらの手法は、未だ不安定な分類性能を提供している。このような問題に対処するために、我々は本レターにおいて、新しいDLベースのアプローチを提案する。そのために、我々は拡張VHR注意モジュール(EAM)を考案し、その後にアトラス空間ピラミッド・プーリング(ASPP)とグローバル平均プーリング(GAP)を行う。この手順により、対応するレベルから強化された特徴が付与される。その後、マルチレベル特徴フュージョンが実行される。広く利用されている2つのVHR RSデータセットを用いた実験結果から、提案手法は、最小標準偏差0.001で、競争力のある安定/頑健な分類性能をもたらすことが示される。さらに、AIDデータセットとNWPUデータセットにおける最高総合精度はそれぞれ95.39%と93.04%であった。

要約(オリジナル)

Very high-resolution (VHR) remote sensing (RS) scene classification is a challenging task due to the higher inter-class similarity and intra-class variability problems. Recently, the existing deep learning (DL)-based methods have shown great promise in VHR RS scene classification. However, they still provide an unstable classification performance. To address such a problem, we, in this letter, propose a novel DL-based approach. For this, we devise an enhanced VHR attention module (EAM), followed by the atrous spatial pyramid pooling (ASPP) and global average pooling (GAP). This procedure imparts the enhanced features from the corresponding level. Then, the multi-level feature fusion is performed. Experimental results on two widely-used VHR RS datasets show that the proposed approach yields a competitive and stable/robust classification performance with the least standard deviation of 0.001. Further, the highest overall accuracies on the AID and the NWPU datasets are 95.39% and 93.04%, respectively.

arxiv情報

著者 Chiranjibi Sitaula,Sumesh KC,Jagannath Aryal
発行日 2023-08-03 11:19:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク