要約
オブジェクト検出 (OD) は、ローカライズされたクラス情報を抽出する際の重要なコンピューター ビジョン手法であることが証明されており、業界で複数の用途に使用されています。
最先端 (SOTA) OD モデルの多くは、中型および大型のオブジェクトでは良好なパフォーマンスを発揮しますが、小さなオブジェクトではパフォーマンスが劣るようです。
ほとんどの産業ユースケースでは、小さなオブジェクトのデータを収集して注釈を付けることは、時間がかかり、人的ミスが発生しやすいため困難です。
さらに、これらのデータセットはバランスが崩れている可能性が高く、多くの場合、非効率的なモデルの収束が生じます。
この課題に取り組むために、この研究では、追加のデータ ポイントを注入して OD モデルのパフォーマンスを向上させる新しいアプローチを紹介します。
合成データ生成を使用すると、小さなオブジェクトのデータ ポイントに対するデータ収集とアノテーションの困難さを最小限に抑え、バランスの取れた分布を持つデータセットを作成できます。
このペーパーでは、OD モデルのより適切なアンカー マッチングを可能にする、単純な比例クラス バランシング手法の効果について説明します。
産業用ユースケース内の実際のデータセットと合成データセットの組み合わせについて、SOTA OD モデル YOLOv5、YOLOv7、SSD のパフォーマンスの比較が行われました。
要約(オリジナル)
Object Detection (OD) has proven to be a significant computer vision method in extracting localized class information and has multiple applications in the industry. Although many of the state-of-the-art (SOTA) OD models perform well on medium and large sized objects, they seem to under perform on small objects. In most of the industrial use cases, it is difficult to collect and annotate data for small objects, as it is time-consuming and prone to human errors. Additionally, those datasets are likely to be unbalanced and often result in an inefficient model convergence. To tackle this challenge, this study presents a novel approach that injects additional data points to improve the performance of the OD models. Using synthetic data generation, the difficulties in data collection and annotations for small object data points can be minimized and to create a dataset with balanced distribution. This paper discusses the effects of a simple proportional class-balancing technique, to enable better anchor matching of the OD models. A comparison was carried out on the performances of the SOTA OD models: YOLOv5, YOLOv7 and SSD, for combinations of real and synthetic datasets within an industrial use case.
arxiv情報
著者 | Jibinraj Antony,Vinit Hegiste,Ali Nazeri,Hooman Tavakoli,Snehal Walunj,Christiane Plociennik,Martin Ruskowski |
発行日 | 2024-01-29 13:18:18+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google