要約
航空画像における物体検出は、地球科学およびリモート センシングの分野における基本的な研究テーマです。
ただし、このトピックに関する高度なアプローチは、主に精巧なバックボーンまたはヘッド ネットワークの設計に焦点を当てていますが、ネック ネットワークは無視しています。
このレターでは、まず、情報のボトルネックの観点から、オブジェクト検出におけるネック ネットワークの重要性を強調します。
次に、現在のアプローチにおける情報不足の問題を軽減するために、双方向のグローバル パターンでバックボーン ネットワークからヘッド ネットワークへのブリッジとして機能するグローバル セマンティック ネットワーク (GSNet) を提案します。
既存のアプローチと比較して、私たちのモデルは、より少ない計算コストで豊富で強化された画像機能をキャプチャできます。
さらに、特徴融合におけるセマンティック ギャップの問題に悩まされているさまざまなレベルの特徴に対して、特徴融合洗練モジュール (FRM) を提案します。
私たちのアプローチの有効性と効率性を実証するために、2 つの挑戦的で代表的な航空画像データセット (DOTA と HRSC2016) に対して実験が行われます。
精度と複雑さの面での実験結果は、私たちの方法の優位性を検証します。
コードは GSNet でオープンソース化されています。
要約(オリジナル)
Object detection in aerial images is a fundamental research topic in the geoscience and remote sensing domain. However, the advanced approaches on this topic mainly focus on designing the elaborate backbones or head networks but ignore neck networks. In this letter, we first underline the importance of the neck network in object detection from the perspective of information bottleneck. Then, to alleviate the information deficiency problem in the current approaches, we propose a global semantic network (GSNet), which acts as a bridge from the backbone network to the head network in a bidirectional global pattern. Compared to the existing approaches, our model can capture the rich and enhanced image features with less computational costs. Besides, we further propose a feature fusion refinement module (FRM) for different levels of features, which are suffering from the problem of semantic gap in feature fusion. To demonstrate the effectiveness and efficiency of our approach, experiments are carried out on two challenging and representative aerial image datasets (i.e., DOTA and HRSC2016). Experimental results in terms of accuracy and complexity validate the superiority of our method. The code has been open-sourced at GSNet.
arxiv情報
著者 | Yuchen Shen,Dong Zhang,Zhihao Song,Xuesong Jiang,Qiaolin Ye |
発行日 | 2023-02-15 06:32:49+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google