要約
小さなオブジェクトには数ピクセルのサイズしか含まれていないため、小さなオブジェクトの検出は非常に難しい問題です。
外観情報が不足しているため、最先端の検出器では小さなオブジェクトに対して満足のいく結果が得られないことを示しています。
私たちの重要な観察は、IoU自体やその拡張などのIntersection over Union(IoU)ベースのメトリックは、小さなオブジェクトの位置偏差に非常に敏感であり、アンカーベースの検出器で使用すると検出パフォーマンスを大幅に低下させることです。
これを軽減するために、ワッサースタイン距離を使用して小さなオブジェクトを検出する新しい評価メトリックを提案します。
具体的には、最初にバウンディングボックスを2Dガウス分布としてモデル化し、次に、対応するガウス分布によってそれらの間の類似性を計算するために、正規化ワッサースタイン距離(NWD)と呼ばれる新しいメトリックを提案します。
提案されたNWDメトリックは、アンカーベースの検出器の割り当て、非最大抑制、および損失関数に簡単に組み込むことができ、一般的に使用されるIoUメトリックを置き換えることができます。
小さなオブジェクト検出(AI-TOD)の新しいデータセットでメトリックを評価します。このデータセットでは、平均オブジェクトサイズが既存のオブジェクト検出データセットよりもはるかに小さくなっています。
広範な実験により、NWDメトリックを装備した場合、私たちのアプローチは、標準の微調整ベースラインより6.7 APポイント高く、最先端の競合他社より6.0APポイント高いパフォーマンスをもたらすことが示されています。
コードはhttps://github.com/jwwangchn/NWDで入手できます。
要約(オリジナル)
Detecting tiny objects is a very challenging problem since a tiny object only contains a few pixels in size. We demonstrate that state-of-the-art detectors do not produce satisfactory results on tiny objects due to the lack of appearance information. Our key observation is that Intersection over Union (IoU) based metrics such as IoU itself and its extensions are very sensitive to the location deviation of the tiny objects, and drastically deteriorate the detection performance when used in anchor-based detectors. To alleviate this, we propose a new evaluation metric using Wasserstein distance for tiny object detection. Specifically, we first model the bounding boxes as 2D Gaussian distributions and then propose a new metric dubbed Normalized Wasserstein Distance (NWD) to compute the similarity between them by their corresponding Gaussian distributions. The proposed NWD metric can be easily embedded into the assignment, non-maximum suppression, and loss function of any anchor-based detector to replace the commonly used IoU metric. We evaluate our metric on a new dataset for tiny object detection (AI-TOD) in which the average object size is much smaller than existing object detection datasets. Extensive experiments show that, when equipped with NWD metric, our approach yields performance that is 6.7 AP points higher than a standard fine-tuning baseline, and 6.0 AP points higher than state-of-the-art competitors. Codes are available at: https://github.com/jwwangchn/NWD.
arxiv情報
著者 | Jinwang Wang,Chang Xu,Wen Yang,Lei Yu |
発行日 | 2022-06-14 12:58:44+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google