OGMN: Occlusion-guided Multi-task Network for Object Detection in UAV Images

要約

タイトル:OGMN:UAVイメージ内の物体検出のための遮蔽ガイドマルチタスクネットワーク

要約:
– UAVイメージにおけるオブジェクト間の遮蔽は、オブジェクト検出における見過ごされる課題の1つです。
– UAVの高度や角度の変化により、UAVイメージの中での遮蔽は自然なシーンイメージよりも頻繁に発生します。
– 自然なシーンイメージの遮蔽に比べて、UAVイメージでの遮蔽は特徴の混乱問題と局所集約特性によって特徴づけられます。
– この課題に対処するために、オブジェクト検出タスクと共にオクルージョンローカリゼーションタスクが導入され、遮蔽ガイドマルチタスクネットワーク(OGMN)が構成されます。
– OGMNには、オクルージョンローカリゼーションと2つの遮蔽ガイドマルチタスクインタラクションが含まれています。
– OEM(オクルージョン推定モジュール)は、遮蔽を正確にローカリゼーションするために提案されています。
– OGMNは、オクルージョンローカリゼーションの結果を使用して、2つのマルチタスクインタラクションを備えた遮蔽ガイド検出を実行します。
– 多数の実験により、OGMNがVisdroneとUAVDTデータセットで高い効果を示し、特にVisdroneデータセットでは35.0%mAPを達成し、ベースラインを5.3%上回ることがわかりました。

要約(オリジナル)

Occlusion between objects is one of the overlooked challenges for object detection in UAV images. Due to the variable altitude and angle of UAVs, occlusion in UAV images happens more frequently than that in natural scenes. Compared to occlusion in natural scene images, occlusion in UAV images happens with feature confusion problem and local aggregation characteristic. And we found that extracting or localizing occlusion between objects is beneficial for the detector to address this challenge. According to this finding, the occlusion localization task is introduced, which together with the object detection task constitutes our occlusion-guided multi-task network (OGMN). The OGMN contains the localization of occlusion and two occlusion-guided multi-task interactions. In detail, an occlusion estimation module (OEM) is proposed to precisely localize occlusion. Then the OGMN utilizes the occlusion localization results to implement occlusion-guided detection with two multi-task interactions. One interaction for the guide is between two task decoders to address the feature confusion problem, and an occlusion decoupling head (ODH) is proposed to replace the general detection head. Another interaction for guide is designed in the detection process according to local aggregation characteristic, and a two-phase progressive refinement process (TPP) is proposed to optimize the detection process. Extensive experiments demonstrate the effectiveness of our OGMN on the Visdrone and UAVDT datasets. In particular, our OGMN achieves 35.0% mAP on the Visdrone dataset and outperforms the baseline by 5.3%. And our OGMN provides a new insight for accurate occlusion localization and achieves competitive detection performance.

arxiv情報

著者 Xuexue Li,Wenhui Diao,Yongqiang Mao,Peng Gao,Xiuhua Mao,Xinming Li,Xian Sun
発行日 2023-04-24 03:30:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CV パーマリンク