H2RBox: Horizontal Box Annotation is All You Need for Oriented Object Detection

要約

しかし,既存の検出ベンチマークは水平バウンディングボックスのアノテーションのみであり,回転バウンディングボックスよりも低コストであるため,容易に利用可能な学習コーパスと指向性物体検出に対する需要の増加の間にギャップがある.本論文では、H2RBoxと呼ばれるシンプルかつ効果的な指向性物体検出手法を提案する。この手法は、弱い教師あり学習で水平方向の箱のアノテーションを用いるだけで、上記のギャップを埋め、回転した箱を用いて学習するものに対しても競争力のある性能を示す。本手法の核となるのは弱教師付き学習と自己教師付き学習であり、2つの異なるビューの整合性を学習することで対象物の角度を予測する。我々の知る限り、H2RBoxは水平ボックスのアノテーションに基づく最初の指向性オブジェクト検出器である。H2RBoxは、水平方向の箱型アノテーションに基づく指向性物体検出を行う最初の手法であり、他の手法である水平方向の箱型アノテーションに基づくインスタンス分割と比較して、マスクの予測精度に依存せず、多数の密集物体や外れ値を含む複雑なシーンにおいてより頑健に動作することができる。実験結果より、H2RBoxは水平ボックス教師ありインスタンス分割法と比較して、性能と速度に大きな優位性があり、メモリ使用量も少ないことがわかった。回転箱教師付き指向性オブジェクト検出器と比較しながら、我々の方法は非常に近い性能と速度を示しています。ソースコードは PyTorch-based \href{https://github.com/yangxue0827/h2rbox-mmrotate}{MMRotate} と Jittor-based \href{https://github.com/yangxue0827/h2rbox-jittor}{JDet} で公開されています。

要約(オリジナル)

Oriented object detection emerges in many applications from aerial images to autonomous driving, while many existing detection benchmarks are annotated with horizontal bounding box only which is also less costive than fine-grained rotated box, leading to a gap between the readily available training corpus and the rising demand for oriented object detection. This paper proposes a simple yet effective oriented object detection approach called H2RBox merely using horizontal box annotation for weakly-supervised training, which closes the above gap and shows competitive performance even against those trained with rotated boxes. The cores of our method are weakly- and self-supervised learning, which predicts the angle of the object by learning the consistency of two different views. To our best knowledge, H2RBox is the first horizontal box annotation-based oriented object detector. Compared to an alternative i.e. horizontal box-supervised instance segmentation with our post adaption to oriented object detection, our approach is not susceptible to the prediction quality of mask and can perform more robustly in complex scenes containing a large number of dense objects and outliers. Experimental results show that H2RBox has significant performance and speed advantages over horizontal box-supervised instance segmentation methods, as well as lower memory requirements. While compared to rotated box-supervised oriented object detectors, our method shows very close performance and speed. The source code is available at PyTorch-based \href{https://github.com/yangxue0827/h2rbox-mmrotate}{MMRotate} and Jittor-based \href{https://github.com/yangxue0827/h2rbox-jittor}{JDet}.

arxiv情報

著者 Xue Yang,Gefan Zhang,Wentong Li,Xuehui Wang,Yue Zhou,Junchi Yan
発行日 2023-02-06 12:08:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.CV パーマリンク