PointOBB-v2: Towards Simpler, Faster, and Stronger Single Point Supervised Oriented Object Detection

要約

単一点教師あり指向物体検出は注目を集め、コミュニティ内で初期の進歩を遂げました。
ワンショット サンプルや強力な事前トレーニング済みモデル (SAM など) に依存するアプローチとは異なり、PointOBB は事前不要の機能により有望性を示しています。
この論文では、他の先行技術に依存せずに点から疑似回転ボックスを生成するための、よりシンプルで高速かつ強力な方法である PointOBB-v2 を提案します。
具体的には、まず、不均一な正および負のサンプリングでネットワークをトレーニングすることにより、クラス確率マップ (CPM) を生成します。
CPM がおおよそのオブジェクト領域とその輪郭を学習できることを示します。
次に、主成分分析 (PCA) を適用して、オブジェクトの方向と境界を正確に推定します。
さらに分離メカニズムを組み込むことで、CPM 上の重複によって引き起こされる混乱を解決し、高密度シナリオでの動作を可能にします。
広範な比較により、DOTA-v1.0/v1.5/v2.0 データセットでは、以前の状態と比較して、私たちのメソッドが 15.58 倍速いトレーニング速度と 11.60%/25.15%/21.19% の精度向上を達成していることが実証されています。
アート、PointOBB。
これにより、モジュラートラックにおける単一点監視付き指向検出の最先端が大幅に進歩します。

要約(オリジナル)

Single point supervised oriented object detection has gained attention and made initial progress within the community. Diverse from those approaches relying on one-shot samples or powerful pretrained models (e.g. SAM), PointOBB has shown promise due to its prior-free feature. In this paper, we propose PointOBB-v2, a simpler, faster, and stronger method to generate pseudo rotated boxes from points without relying on any other prior. Specifically, we first generate a Class Probability Map (CPM) by training the network with non-uniform positive and negative sampling. We show that the CPM is able to learn the approximate object regions and their contours. Then, Principal Component Analysis (PCA) is applied to accurately estimate the orientation and the boundary of objects. By further incorporating a separation mechanism, we resolve the confusion caused by the overlapping on the CPM, enabling its operation in high-density scenarios. Extensive comparisons demonstrate that our method achieves a training speed 15.58x faster and an accuracy improvement of 11.60%/25.15%/21.19% on the DOTA-v1.0/v1.5/v2.0 datasets compared to the previous state-of-the-art, PointOBB. This significantly advances the cutting edge of single point supervised oriented detection in the modular track.

arxiv情報

著者 Botao Ren,Xue Yang,Yi Yu,Junwei Luo,Zhidong Deng
発行日 2024-10-10 17:59:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク