CrowdSim2: an Open Synthetic Benchmark for Object Detectors


– データの不足は、コンピュータビジョンにおける人工知能を用いた教師ありモデルの開発の主な障壁の1つとなっている。
– ディープラーニングベースのモデルは、トレーニング中に見たことがない新しいシナリオに適用するとシステマティックに問題を抱え、一般的でないが重要な実世界シナリオでは十分にテストされない場合がある。
– この論文では、Unityグラフィカルエンジンに基づくシミュレータから収集された人と車の検出に適した新しい合成画像コレクション「CrowdSim2」を公開する。
– これは、天候条件やシーン内のオブジェクト数などの興味深い要因をいくつか変化させた、実世界に似た様々なシンセティックシナリオから収集された数千の画像で構成されている。
– ラベルは自動的に収集され、2つのオブジェクトクラスに属する詳細なバウンディングボックスでオブジェクトを正確にローカライズし、ヒトを注釈パイプラインから除外している。
– 著者らは、最新の検出器をテストする評価基準としてCrowdSim2を利用し、制御された環境での検出性能を計測する貴重なツールであることを示している。


Data scarcity has become one of the main obstacles to developing supervised models based on Artificial Intelligence in Computer Vision. Indeed, Deep Learning-based models systematically struggle when applied in new scenarios never seen during training and may not be adequately tested in non-ordinary yet crucial real-world situations. This paper presents and publicly releases CrowdSim2, a new synthetic collection of images suitable for people and vehicle detection gathered from a simulator based on the Unity graphical engine. It consists of thousands of images gathered from various synthetic scenarios resembling the real world, where we varied some factors of interest, such as the weather conditions and the number of objects in the scenes. The labels are automatically collected and consist of bounding boxes that precisely localize objects belonging to the two object classes, leaving out humans from the annotation pipeline. We exploited this new benchmark as a testing ground for some state-of-the-art detectors, showing that our simulated scenarios can be a valuable tool for measuring their performances in a controlled environment.


著者 Paweł Foszner,Agnieszka Szczęsna,Luca Ciampi,Nicola Messina,Adam Cygan,Bartosz Bizoń,Michał Cogiel,Dominik Golba,Elżbieta Macioszek,Michał Staniszewski
発行日 2023-04-11 09:35:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, OpenAI

カテゴリー: cs.CV パーマリンク