Strip R-CNN: Large Strip Convolution for Remote Sensing Object Detection

要約

急速な発展が見られる一方で、リモートセンシングによる物体検出は依然として高アスペクト比の物体を検出することが困難です。
この論文は、大きなストリップ畳み込みがリモート センシング物体検出の優れた特徴表現学習器であり、さまざまなアスペクト比の物体を適切に検出できることを示しています。
大規模なストリップ畳み込みに基づいて、シンプル、効率的、強力な Strip R-CNN と呼ばれる新しいネットワーク アーキテクチャを構築します。
正方形のラージカーネルコンボリューションを利用する最近のリモートセンシング物体検出器とは異なり、当社のストリップ R-CNN は、連続した直交するラージストリップコンボリューションを利用して空間情報をキャプチャします。
さらに、検出ヘッドを切り離し、位置特定ヘッドにストリップコンボリューションを装備することで、リモートセンシング物体検出器の位置特定機能を強化して、ターゲットオブジェクトの位置をより正確に特定します。
DOTA、FAIR1M、HRSC2016、DIOR などのいくつかのベンチマークに関する広範な実験により、Strip R-CNN が以前の研究を大幅に改善できることが示されました。
特に、当社の 30M モデルは DOTA-v1.0 で 82.75% の mAP を達成し、新しい最先端の記録を打ち立てています。コードは https://github.com/YXB-NKU/Strip-R-CNN で入手できます。

要約(オリジナル)

While witnessed with rapid development, remote sensing object detection remains challenging for detecting high aspect ratio objects. This paper shows that large strip convolutions are good feature representation learners for remote sensing object detection and can detect objects of various aspect ratios well. Based on large strip convolutions, we build a new network architecture called Strip R-CNN, which is simple, efficient, and powerful. Unlike recent remote sensing object detectors that leverage large-kernel convolutions with square shapes, our Strip R-CNN takes advantage of sequential orthogonal large strip convolutions to capture spatial information. In addition, we enhance the localization capability of remote-sensing object detectors by decoupling the detection heads and equipping the localization head with strip convolutions to better localize the target objects. Extensive experiments on several benchmarks, e.g., DOTA, FAIR1M, HRSC2016, and DIOR, show that our Strip R-CNN can largely improve previous works. Notably, our 30M model achieves 82.75% mAP on DOTA-v1.0, setting a new state-of-the-art record.Code is available at https://github.com/YXB-NKU/Strip-R-CNN.

arxiv情報

著者 Xinbin Yuan,ZhaoHui Zheng,Yuxuan Li,Xialei Liu,Li Liu,Xiang Li,Qibin Hou,Ming-Ming Cheng
発行日 2025-01-07 13:30:54+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク