要約
航空画像での物体検出は、地球科学およびリモートセンシングの分野における基礎研究のトピックです。
ただし、このトピックに関する高度なアプローチは、主に複雑なバックボーンまたはヘッドネットワークの設計に焦点を当てていますが、ネックネットワークは無視しています。
この手紙では、最初に、情報のボトルネックの観点から、オブジェクト検出におけるネックネットワークの重要性を強調します。
次に、現在のアプローチにおける情報不足の問題を軽減するために、双方向のグローバルパターンでバックボーンネットワークからヘッドネットワークへのブリッジとして機能するグローバルセマンティックネットワーク(GSNet)を提案します。
既存のアプローチと比較して、私たちのモデルは、より少ない計算コストで、豊富で強化された画像機能をキャプチャできます。
さらに、機能融合におけるセマンティックギャップの問題に悩まされているさまざまなレベルの機能のための機能融合改良モジュール(FRM)をさらに提案します。
私たちのアプローチの有効性と効率を実証するために、2つの挑戦的で代表的な航空画像データセット(つまり、DOTAとHRSC2016)で実験が行われます。
精度と複雑さに関する実験結果は、私たちの方法の優位性を検証します。
コードはGSNetでオープンソース化されています。
要約(オリジナル)
Object detection in aerial images is a fundamental research topic in the geoscience and remote sensing domain. However, the advanced approaches on this topic mainly focus on designing the elaborate backbones or head networks but ignore neck networks. In this letter, we first underline the importance of the neck network in object detection from the perspective of information bottleneck. Then, to alleviate the information deficiency problem in the current approaches, we propose a global semantic network (GSNet), which acts as a bridge from the backbone network to the head network in a bidirectional global pattern. Compared to the existing approaches, our model can capture the rich and enhanced image features with less computational costs. Besides, we further propose a feature fusion refinement module (FRM) for different levels of features, which are suffering from the problem of semantic gap in feature fusion. To demonstrate the effectiveness and efficiency of our approach, experiments are carried out on two challenging and representative aerial image datasets (i.e., DOTA and HRSC2016). Experimental results in terms of accuracy and complexity validate the superiority of our method. The code has been open-sourced at GSNet.
arxiv情報
著者 | Yuchen Shen,Dong Zhang,Zhihao Song,Xuesong Jiang,Qiaolin Ye |
発行日 | 2022-06-28 07:25:09+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google