H2RBox-v2: Boosting HBox-supervised Oriented Object Detection via Symmetric Learning


タイトル:シンメトリックラーニングを用いたHBox-supervised Oriented Object Detectionの向上


– HBox-supervised Oriented Object Detectionは、回転した物体について註釈付けすることが必要なため、労力を要するタスクである。
– 既存の水平方向にアノテーションがされたデータセットをフル活用し、アノテーションコストを削減するために、H2RBox弱教師あり検出器が提案され、注目されている。
– この論文では、HBox-supervisedとRBox-supervisedのオブジェクト検出のギャップをより埋めるための新しいバージョン、H2RBox-v2が提案されている。
– 軸対称性を利用した反転や回転の一貫性を理論的に解析しながら、H2RBoxと同様の弱教師ありブランチを使用して、自己教師ありブランチを埋め込むことで、シンメトリーなイメージから方向を学習する。
– 周辺問題に対処するためのモジュールも補完され、安定かつ効果的な解決策が実現されている。
– H2RBox-v2は、シンメトリーによる監視の最初の範例であり、低品質なアノテーションや不十分なトレーニングデータに対しても、H2RBoxに比べて感受性が低く、完全に教師ありのオブジェクト検出器に近づくより競争力のあるパフォーマンスが期待されている。
– 具体的なパフォーマンスの比較は、DOTA-v1.0/1.5/2.0において、H2RBox-v2とRotated FCOSの比較では、72.31%/64.76%/50.33% vs. 72.44%/64.53%/51.77%であり、HRSCでは89.66% vs. 88.99%、FAIR1Mでは42.27% vs. 41.25%である。


With the increasing demand for oriented object detection e.g. in autonomous driving and remote sensing, the oriented annotation has become a labor-intensive work. To make full use of existing horizontally annotated datasets and reduce the annotation cost, a weakly-supervised detector H2RBox for learning the rotated box (RBox) from the horizontal box (HBox) has been proposed and received great attention. This paper presents a new version, H2RBox-v2, to further bridge the gap between HBox-supervised and RBox-supervised oriented object detection. While exploiting axisymmetry via flipping and rotating consistencies is available through our theoretical analysis, H2RBox-v2, using a weakly-supervised branch similar to H2RBox, is embedded with a novel self-supervised branch that learns orientations from the symmetry inherent in the image of objects. Complemented by modules to cope with peripheral issues, e.g. angular periodicity, a stable and effective solution is achieved. To our knowledge, H2RBox-v2 is the first symmetry-supervised paradigm for oriented object detection. Compared to H2RBox, our method is less susceptible to low annotation quality and insufficient training data, which in such cases is expected to give a competitive performance much closer to fully-supervised oriented object detectors. Specifically, the performance comparison between H2RBox-v2 and Rotated FCOS on DOTA-v1.0/1.5/2.0 is 72.31%/64.76%/50.33% vs. 72.44%/64.53%/51.77%, 89.66% vs. 88.99% on HRSC, and 42.27% vs. 41.25% on FAIR1M.


著者 Yi Yu,Xue Yang,Qingyun Li,Yue Zhou,Gefan Zhang,Feipeng Da,Junchi Yan
発行日 2023-04-11 13:21:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.CV パーマリンク