Similarity Distance-Based Label Assignment for Tiny Object Detection

要約

小さなオブジェクトの検出は、オブジェクトのサイズが限られていて情報が不足しているため、コンピュータ ビジョンにおいて最も困難なタスクの 1 つになりつつあります。
ラベル割り当て戦略は、オブジェクト検出の精度に影響を与える重要な要素です。
小さなオブジェクトに対して効果的なラベル割り当て戦略がいくつかありますが、そのほとんどは、境界ボックスの感度を下げて陽性サンプルの数を増やすことに焦点を当てており、いくつかの固定ハイパーパラメーターを設定する必要があります。
ただし、より多くの陽性サンプルが必ずしもより良い検出結果につながるとは限りません。実際、過剰な陽性サンプルはより多くの偽陽性につながる可能性があります。
この論文では、境界ボックス間の類似性を評価するために、Similarity Distance (SimD) という名前のシンプルだが効果的な戦略を紹介します。
この提案された戦略は、位置と形状の両方の類似性を考慮するだけでなく、ハイパーパラメーターを適応的に学習し、異なるデータセットやデータセット内のさまざまなオブジェクト サイズに確実に適応できるようにします。
私たちのアプローチは、ラベル割り当てと非最大抑制 (NMS) のための IoU の代わりに、一般的なアンカーベースの検出器に簡単に適用できます。
4つの主流の微小物体検出データセットに関する広範な実験により、私たちの方法の優れたパフォーマンス、特にAI-TODの最先端の競合他社よりも非常に小さい1.8 APポイントと4.1 APポイントが高いことが実証されました。
コードは \url{https://github.com/cszzshi/SimD} から入手できます。

要約(オリジナル)

Tiny object detection is becoming one of the most challenging tasks in computer vision because of the limited object size and lack of information. The label assignment strategy is a key factor affecting the accuracy of object detection. Although there are some effective label assignment strategies for tiny objects, most of them focus on reducing the sensitivity to the bounding boxes to increase the number of positive samples and have some fixed hyperparameters need to set. However, more positive samples may not necessarily lead to better detection results, in fact, excessive positive samples may lead to more false positives. In this paper, we introduce a simple but effective strategy named the Similarity Distance (SimD) to evaluate the similarity between bounding boxes. This proposed strategy not only considers both location and shape similarity but also learns hyperparameters adaptively, ensuring that it can adapt to different datasets and various object sizes in a dataset. Our approach can be simply applied in common anchor-based detectors in place of the IoU for label assignment and Non Maximum Suppression (NMS). Extensive experiments on four mainstream tiny object detection datasets demonstrate superior performance of our method, especially, 1.8 AP points and 4.1 AP points of very tiny higher than the state-of-the-art competitors on AI-TOD. Code is available at: \url{https://github.com/cszzshi/SimD}.

arxiv情報

著者 Shuohao Shi,Qiang Fang,Tong Zhao,Xin Xu
発行日 2024-07-26 09:15:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク