要約
多くの物体検出モデルは、サンプル数の少なさ、多様性の欠如、特徴表現の少なさなど、小物体検出のいくつかの問題点に苦慮している。GANは生成モデルクラスに属することを考慮すると、その最初の目的は、任意のデータ分布を模倣するように学習することである。適切なGANモデルを用いることで、低精度データの量と多様性を増大させることができる。このソリューションにより、物体検出の結果が改善される可能性がある。さらに、GANベースのアーキテクチャを深層学習モデル内に組み込むことで、小さなオブジェクトの認識精度を向上させることができる。本研究では、VOC Pascalデータセットにおける小オブジェクト検出を改善するために、オーグメンテーションを用いたGANベースの手法を提示する。本手法は、オブジェクトの回転やシフトなど、様々な一般的な拡張戦略と比較される。実験はFasterRCNNモデルに基づいている。
要約(オリジナル)
Many object detection models struggle with several problematic aspects of small object detection including the low number of samples, lack of diversity and low features representation. Taking into account that GANs belong to generative models class, their initial objective is to learn to mimic any data distribution. Using the proper GAN model would enable augmenting low precision data increasing their amount and diversity. This solution could potentially result in improved object detection results. Additionally, incorporating GAN-based architecture inside deep learning model can increase accuracy of small objects recognition. In this work the GAN-based method with augmentation is presented to improve small object detection on VOC Pascal dataset. The method is compared with different popular augmentation strategies like object rotations, shifts etc. The experiments are based on FasterRCNN model.
arxiv情報
著者 | Magdalena Stachoń,Marcin Pietroń |
発行日 | 2022-09-02 08:20:07+00:00 |
arxivサイト | arxiv_id(pdf) |