Towards Large-Scale Small Object Detection: Survey and Benchmarks

要約

タイトル: 大規模小物体検出に向けた調査とベンチマーク
要約:
– 深層畳み込みニューラルネットワークの出現により、物体検出は過去数年間で顕著な進歩を遂げた。
– しかし、小さなターゲットの固有構造による視覚的な外観とノイズのために、Small Object Detection (SOD) という、コンピュータビジョンで悪名高いタスクの不十分な状況を隠すことはできなかった。
– また、小物体検出方法のベンチマーク用の大規模データセットは、ボトルネックとなっている。
– この論文では、まず小物体検出について徹底的な調査を行い、次にSODの開発を促進するために、2つの大規模な小物体検出用データセット(SODA)、SODA-D、SODA-Aを構築する。SODA-Dには、高品質の交通画像24828枚と9つのカテゴリーの278433個のインスタンスが含まれている。SODA-Aには、高解像度の航空画像2513枚と9つのカテゴリーの872069のインスタンスをアノテーションしている。提案されたデータセットは、マルチカテゴリーSOD向けの徹底的にアノテーションされた膨大なコレクションであり、今までで初めての大規模なベンチマークの試みである。
– 最後に、主流の方法のパフォーマンスをSODAで評価する。提供されるベンチマークがSODの発展を促進し、この分野でのさらなる突破口を生み出すことを期待している。データセットとコードは\url{https://shaunyuan22.github.io/SODA}で入手可能である。

要約(オリジナル)

With the rise of deep convolutional neural networks, object detection has achieved prominent advances in past years. However, such prosperity could not camouflage the unsatisfactory situation of Small Object Detection (SOD), one of the notoriously challenging tasks in computer vision, owing to the poor visual appearance and noisy representation caused by the intrinsic structure of small targets. In addition, large-scale dataset for benchmarking small object detection methods remains a bottleneck. In this paper, we first conduct a thorough review of small object detection. Then, to catalyze the development of SOD, we construct two large-scale Small Object Detection dAtasets (SODA), SODA-D and SODA-A, which focus on the Driving and Aerial scenarios respectively. SODA-D includes 24828 high-quality traffic images and 278433 instances of nine categories. For SODA-A, we harvest 2513 high resolution aerial images and annotate 872069 instances over nine classes. The proposed datasets, as we know, are the first-ever attempt to large-scale benchmarks with a vast collection of exhaustively annotated instances tailored for multi-category SOD. Finally, we evaluate the performance of mainstream methods on SODA. We expect the released benchmarks could facilitate the development of SOD and spawn more breakthroughs in this field. Datasets and codes are available at: \url{https://shaunyuan22.github.io/SODA}.

arxiv情報

著者 Gong Cheng,Xiang Yuan,Xiwen Yao,Kebing Yan,Qinghua Zeng,Xingxing Xie,Junwei Han
発行日 2023-04-11 03:58:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CV パーマリンク