要約
小さなオブジェクトには数ピクセルしか含まれていないため、航空写真での小さなオブジェクトの検出(TOD)は困難です。
最先端のオブジェクト検出器は、識別機能からの監視が不足しているため、小さなオブジェクトに対して満足のいく結果を提供しません。
私たちの重要な観察は、Intersection over Union(IoU)メトリックとその拡張は、アンカーベースの検出器で使用される場合、ラベル割り当ての品質を大幅に低下させる小さなオブジェクトの位置偏差に非常に敏感であるということです。
この問題に取り組むために、正規化ワッサースタイン距離(NWD)と呼ばれる新しい評価メトリックと小さなオブジェクト検出のための新しいRanKingベースの割り当て(RKA)戦略を提案します。
提案されたNWD-RKA戦略は、あらゆる種類のアンカーベースの検出器に簡単に組み込むことができ、標準のIoUしきい値ベースの検出器に取って代わり、ラベルの割り当てを大幅に改善し、ネットワークトレーニングに十分な監視情報を提供します。
4つのデータセットでテストされたNWD-RKAは、小さなオブジェクトの検出パフォーマンスを大幅に向上させることができます。
さらに、航空写真の小さなオブジェクト検出(AI-TOD)データセットで目立つノイズのあるラベルを観察することで、細心の注意を払ってラベルを付け直し、AI-TOD-v2とそれに対応するベンチマークをリリースすることに意欲的です。
AI-TOD-v2では、注釈の欠落と位置エラーの問題が大幅に軽減され、より信頼性の高いトレーニングと検証プロセスが容易になります。
NWD-RKAをDetectoRSに組み込むことで、検出パフォーマンスはAI-TOD-v2の最先端の競合他社よりも4.3APポイント向上します。
データセット、コード、その他の視覚化は、https://chasel-tsui.github.io/AI-TOD-v2/で入手できます。
要約(オリジナル)
Tiny object detection (TOD) in aerial images is challenging since a tiny object only contains a few pixels. State-of-the-art object detectors do not provide satisfactory results on tiny objects due to the lack of supervision from discriminative features. Our key observation is that the Intersection over Union (IoU) metric and its extensions are very sensitive to the location deviation of the tiny objects, which drastically deteriorates the quality of label assignment when used in anchor-based detectors. To tackle this problem, we propose a new evaluation metric dubbed Normalized Wasserstein Distance (NWD) and a new RanKing-based Assigning (RKA) strategy for tiny object detection. The proposed NWD-RKA strategy can be easily embedded into all kinds of anchor-based detectors to replace the standard IoU threshold-based one, significantly improving label assignment and providing sufficient supervision information for network training. Tested on four datasets, NWD-RKA can consistently improve tiny object detection performance by a large margin. Besides, observing prominent noisy labels in the Tiny Object Detection in Aerial Images (AI-TOD) dataset, we are motivated to meticulously relabel it and release AI-TOD-v2 and its corresponding benchmark. In AI-TOD-v2, the missing annotation and location error problems are considerably mitigated, facilitating more reliable training and validation processes. Embedding NWD-RKA into DetectoRS, the detection performance achieves 4.3 AP points improvement over state-of-the-art competitors on AI-TOD-v2. Datasets, codes, and more visualizations are available at: https://chasel-tsui.github.io/AI-TOD-v2/
arxiv情報
著者 | Chang Xu,Jinwang Wang,Wen Yang,Huai Yu,Lei Yu,Gui-Song Xia |
発行日 | 2022-06-28 13:33:06+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google