要約
任意指向型物体検出(AOOD)は、リモートセンシングシナリオにおける画像理解のために重要な役割を果たす。既存のAOOD手法は、角度表現における曖昧さと高いコストという課題に直面している。そこで、粗視化角度分類(CAC)と細粒度角度回帰(FAR)からなる多視化角度表現(MGAR)手法を提案する。具体的には、設計されたCACは離散角度符号化(DAE)による角度予測の曖昧さを回避し、DAEの粒度を粗くすることで複雑さを軽減している。CACに基づき、FARが開発され、DAE の粒度を狭くするよりもはるかに低いコストで角度予測を精緻化することができる。さらに、Intersection over Union (IoU) aware FAR-Loss (IFL) を設計し、IoUに導かれた適応的な再重み付け機構を用いて、角度予測の精度を向上させることを目的とする。提案するMGARの有効性を実証するため、複数の公共リモートセンシングデータセットを用いた広範な実験を行った。さらに、組み込みデバイスを用いた実験により、提案するMGARが軽量なデプロイメントにも適していることを示す。
要約(オリジナル)
Arbitrary-oriented object detection (AOOD) plays a significant role for image understanding in remote sensing scenarios. The existing AOOD methods face the challenges of ambiguity and high costs in angle representation. To this end, a multi-grained angle representation (MGAR) method, consisting of coarse-grained angle classification (CAC) and fine-grained angle regression (FAR), is proposed. Specifically, the designed CAC avoids the ambiguity of angle prediction by discrete angular encoding (DAE) and reduces complexity by coarsening the granularity of DAE. Based on CAC, FAR is developed to refine the angle prediction with much lower costs than narrowing the granularity of DAE. Furthermore, an Intersection over Union (IoU) aware FAR-Loss (IFL) is designed to improve accuracy of angle prediction using an adaptive re-weighting mechanism guided by IoU. Extensive experiments are performed on several public remote sensing datasets, which demonstrate the effectiveness of the proposed MGAR. Moreover, experiments on embedded devices demonstrate that the proposed MGAR is also friendly for lightweight deployments.
arxiv情報
著者 | Hao Wang,Zhanchao Huang,Zhengchao Chen,Ying Song,Wei Li |
発行日 | 2022-10-04 15:28:26+00:00 |
arxivサイト | arxiv_id(pdf) |