Similarity Distance-Based Label Assignment for Tiny Object Detection

要約

微小物体検出は、物体の大きさが限られ、情報が不足しているため、コンピュータビジョンにおいて最も困難なタスクの1つとなっている。ラベル割り当て戦略は、物体検出の精度に影響を与える重要な要素である。微小物体に対する効果的なラベル割り当て戦略はいくつか存在するが、そのほとんどは、正のサンプル数を増やすためにバウンディングボックスの感度を下げることに焦点を当て、いくつかの固定ハイパーパラメータを設定する必要がある。しかし、正サンプル数が多ければ良い検出結果が得られるとは限らず、むしろ過剰な正サンプルは誤検出を増やす可能性がある。本論文では、バウンディングボックス間の類似度を評価するために、単純だが効果的な戦略である類似度距離(SimD)を導入する。この提案手法は、位置と形状の類似性の両方を考慮するだけでなく、ハイパーパラメータを適応的に学習することで、異なるデータセットや、データセット中の様々なオブジェクトサイズに適応できることを保証する。我々のアプローチは、ラベル割り当てと非最大抑制(NMS)のためのIoUの代わりに、一般的なアンカーベースの検出器に単純に適用することができる。4つの主要な微小物体検出データセットに対する広範な実験により、本手法の優れた性能が実証され、特に、AI-TODにおいて、1.8APポイントと4.1APポイントの微小物体検出性能が、競合する最先端技術よりも高いことが示された。コードは以下から入手可能:\https://github.com/cszzshi/SimD}。

要約(オリジナル)

Tiny object detection is becoming one of the most challenging tasks in computer vision because of the limited object size and lack of information. The label assignment strategy is a key factor affecting the accuracy of object detection. Although there are some effective label assignment strategies for tiny objects, most of them focus on reducing the sensitivity to the bounding boxes to increase the number of positive samples and have some fixed hyperparameters need to set. However, more positive samples may not necessarily lead to better detection results, in fact, excessive positive samples may lead to more false positives. In this paper, we introduce a simple but effective strategy named the Similarity Distance (SimD) to evaluate the similarity between bounding boxes. This proposed strategy not only considers both location and shape similarity but also learns hyperparameters adaptively, ensuring that it can adapt to different datasets and various object sizes in a dataset. Our approach can be simply applied in common anchor-based detectors in place of the IoU for label assignment and Non Maximum Suppression (NMS). Extensive experiments on four mainstream tiny object detection datasets demonstrate superior performance of our method, especially, 1.8 AP points and 4.1 AP points of very tiny higher than the state-of-the-art competitors on AI-TOD. Code is available at: \url{https://github.com/cszzshi/SimD}.

arxiv情報

著者 Shuohao Shi,Qiang Fang,Tong Zhao,Xin Xu
発行日 2024-07-03 05:36:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク