PP-YOLOE-R: An Efficient Anchor-Free Rotated Object Detector

要約

任意方向の物体検出は、空中画像やシーンテキストを含むビジュアルシーンにおける基本的なタスクである。本報告では、PP-YOLOEに基づく効率的なアンカーフリー回転物体検出器であるPP-YOLOE-Rを紹介する。PP-YOLOE-Rでは、パラメータと計算コストを最小限に抑えながら検出精度を向上させるために、有用なトリックを導入しています。その結果、DOTA 1.0データセットにおいて、シングルスケールの学習とテストにより、PP-YOLOE-R-lとPP-YOLOE-R-xはそれぞれ78.14と78.28 mAPを達成し、他の回転物体検出器をほとんど上回る性能を示しました。マルチスケール学習・テストでは、PP-YOLOE-R-lとPP-YOLOE-R-xは検出精度をさらに向上させ、80.02mAPと80.73mAPを達成しました。この場合,PP-YOLOE-R-xはすべてのアンカーフリー手法を上回り,最新のアンカーベース2ステージモデルに匹敵する性能を示します.さらに、PP-YOLOE-Rは展開に優れ、PP-YOLOE-R-s/m/l/xはTensorRTとFP16-精度のRTX 2080 Tiでそれぞれ69.8/55.1/48.3/37.1 FPSに達することができます。ソースコードと事前学習済みモデルは、https://github.com/PaddlePaddle/Paddle を利用した https://github.com/PaddlePaddle/PaddleDetection で入手可能です。

要約(オリジナル)

Arbitrary-oriented object detection is a fundamental task in visual scenes involving aerial images and scene text. In this report, we present PP-YOLOE-R, an efficient anchor-free rotated object detector based on PP-YOLOE. We introduce a bag of useful tricks in PP-YOLOE-R to improve detection precision with marginal extra parameters and computational cost. As a result, PP-YOLOE-R-l and PP-YOLOE-R-x achieve 78.14 and 78.28 mAP respectively on DOTA 1.0 dataset with single-scale training and testing, which outperform almost all other rotated object detectors. With multi-scale training and testing, PP-YOLOE-R-l and PP-YOLOE-R-x further improve the detection precision to 80.02 and 80.73 mAP. In this case, PP-YOLOE-R-x surpasses all anchor-free methods and demonstrates competitive performance to state-of-the-art anchor-based two-stage models. Further, PP-YOLOE-R is deployment friendly and PP-YOLOE-R-s/m/l/x can reach 69.8/55.1/48.3/37.1 FPS respectively on RTX 2080 Ti with TensorRT and FP16-precision. Source code and pre-trained models are available at https://github.com/PaddlePaddle/PaddleDetection, which is powered by https://github.com/PaddlePaddle/Paddle.

arxiv情報

著者 Xinxin Wang,Guanzhong Wang,Qingqing Dang,Yi Liu,Xiaoguang Hu,Dianhai Yu
発行日 2022-11-04 11:38:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク