H2RBox-v2: Boosting HBox-supervised Oriented Object Detection via Symmetric Learning

要約

【タイトル】対称的な学習によるHBox監視型向きオブジェクト検出の強化、H2RBox-v2
【要約】自律運転やリモートセンシングなどの向きオブジェクト検出の需要が高まる中、向きのアノテーションは労働集約的な作業となっている。水平アノテーションがされたデータセットを有効活用し、アノテーションのコストを削減するために、水弱監視ディテクターH2RBoxが提案され、多くの注目を集めた。本論文では、HBox監視型とRBox監視型の向きオブジェクト検出のギャップを更に埋めるための新しいバージョンである、H2RBox-v2を提案する。H2RBox-v2は、回転対称性をフリップや回転の一致によって活用する理論分析に基づいている。H2RBoxと同様に弱監視枝(部分システム)を使いながら、新しい自己監視枝を埋め込むことにより、画像に備わっている対称性から方向を学ぶことができる。角度周期性などの周辺的な課題に対処するモジュールも補完されており、安定かつ効果的なソリューションが実現されている。知識によれば、H2RBox-v2は向きオブジェクト検出のための最初の対称監視パラダイムである。H2RBoxと比較して、低いアノテーション品質や不十分なトレーニングデータに対して、私たちの方法はより競争力のある性能を提供することが期待されている。具体的には、DOTA-v1.0/1.5/2.0におけるH2RBox-v2とRotated FCOSとの性能比較は、72.31%/64.76%/50.33% vs.72.44%/64.53%/51.77%、HRSCにおける89.66% vs.88.99%、FAIR1Mにおける42.27% vs.41.25%となっている。

– 自律運転やリモートセンシングなどのニーズに応えるために、向きオブジェクト検出のための新しいバージョン「H2RBox-v2」を提案した。
– 新しい自己監視枝を埋込むことで、画像の持つ対称性から方向を学び、周辺的な課題に対応するためのモジュールも補完されている。
– 「H2RBox-v2」は向きオブジェクト検出のための最初の対称監視パラダイムである。
– 「H2RBox-v2」は低いアノテーション品質や不十分なトレーニングデータにも対応しており、H2RBoxと比べてより競争力のある性能を提供することが期待されている。
– 本アルゴリズムはDOTA-v1.0/1.5/2.0で Rotated FCOSと比較し、性能比較は、72.31%/64.76%/50.33% vs. 72.44%/64.53%/51.77%、HRSCにおける89.66% vs.88.99%、FAIR1Mにおける42.27% vs.41.25%となっている。

要約(オリジナル)

With the increasing demand for oriented object detection e.g. in autonomous driving and remote sensing, the oriented annotation has become a labor-intensive work. To make full use of existing horizontally annotated datasets and reduce the annotation cost, a weakly-supervised detector H2RBox for learning the rotated box (RBox) from the horizontal box (HBox) has been proposed and received great attention. This paper presents a new version, H2RBox-v2, to further bridge the gap between HBox-supervised and RBox-supervised oriented object detection. While exploiting axisymmetry via flipping and rotating consistencies is available through our theoretical analysis, H2RBox-v2, using a weakly-supervised branch similar to H2RBox, is embedded with a novel self-supervised branch that learns orientations from the symmetry inherent in the image of objects. Complemented by modules to cope with peripheral issues, e.g. angular periodicity, a stable and effective solution is achieved. To our knowledge, H2RBox-v2 is the first symmetry-supervised paradigm for oriented object detection. Compared to H2RBox, our method is less susceptible to low annotation quality and insufficient training data, which in such cases is expected to give a competitive performance much closer to fully-supervised oriented object detectors. Specifically, the performance comparison between H2RBox-v2 and Rotated FCOS on DOTA-v1.0/1.5/2.0 is 72.31%/64.76%/50.33% vs. 72.44%/64.53%/51.77%, 89.66% vs. 88.99% on HRSC, and 42.27% vs. 41.25% on FAIR1M.

arxiv情報

著者 Yi Yu,Xue Yang,Qingyun Li,Yue Zhou,Gefan Zhang,Junchi Yan,Feipeng Da
発行日 2023-04-10 06:11:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.CV パーマリンク