DQ-DETR: DETR with Dynamic Query for Tiny Object Detection

要約

これまでの DETR のような手法は一般的な物体検出では成功してきたにもかかわらず、物体クエリの位置情報が一般的な物体よりもスケールが非常に小さい微小な物体の検出用にカスタマイズされていないため、微小な物体の検出は依然として困難な課題です。
また、固定数のクエリを使用する DETR のようなメソッドは、小さなオブジェクトのみを含む航空データセットには適さず、異なる画像間でインスタンスの数が不均衡になります。
したがって、我々は、DQ-DETR と呼ばれる、シンプルでありながら効果的なモデルを提案します。このモデルは、上記の問題を解決するための、カテゴリカル計数モジュール、計数ガイドによる特徴拡張、および動的クエリ選択の 3 つの異なるコンポーネントで構成されています。
DQ-DETR は、カテゴリカル カウント モジュールからの予測マップと密度マップを使用して、オブジェクト クエリの数を動的に調整し、クエリの位置情報を改善します。
私たちのモデル DQ-DETR は、以前の CNN ベースや DETR のような手法を上回り、ほとんどが小さなオブジェクトで構成される AI-TOD-V2 データセット上で最先端の mAP 30.2% を達成しました。

要約(オリジナル)

Despite previous DETR-like methods having performed successfully in generic object detection, tiny object detection is still a challenging task for them since the positional information of object queries is not customized for detecting tiny objects, whose scale is extraordinarily smaller than general objects. Also, DETR-like methods using a fixed number of queries make them unsuitable for aerial datasets, which only contain tiny objects, and the numbers of instances are imbalanced between different images. Thus, we present a simple yet effective model, named DQ-DETR, which consists of three different components: categorical counting module, counting-guided feature enhancement, and dynamic query selection to solve the above-mentioned problems. DQ-DETR uses the prediction and density maps from the categorical counting module to dynamically adjust the number of object queries and improve the positional information of queries. Our model DQ-DETR outperforms previous CNN-based and DETR-like methods, achieving state-of-the-art mAP 30.2% on the AI-TOD-V2 dataset, which mostly consists of tiny objects.

arxiv情報

著者 Yi-Xin Huang,Hou-I Liu,Hong-Han Shuai,Wen-Huang Cheng
発行日 2024-08-26 16:22:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク