要約
自動車関連のデータセットは、これまで自動運転システムのトレーニングや車両分類タスクに使用されてきました。
しかし、自動車部品検出のための自動車 AI の分野にはデータセットが不足しており、利用可能なデータセットのほとんどはサイズと範囲が限られており、多様なシナリオをカバーするのに苦労しています。
このギャップに対処するために、この論文では、12 種類の自動車部品を検出するための 84,162 枚の画像から構成される大規模できめの細かい自動車データセットを紹介します。
このデータセットは、さまざまな自動車ブランド、シナリオ、撮影角度をカバーする自然のカメラとオンライン Web サイトから収集されました。
手動アノテーションの負担を軽減するために、最先端の事前トレーニング済み検出器を活用した、新しい半教師あり自動ラベル付け方法を提案します。
さらに、ゼロショットラベリングに対するグラウンディング DINO アプローチの限界を研究します。
最後に、いくつかの軽量 YOLO シリーズ検出器をトレーニングすることにより、きめ細かい自動車部品検出を通じて、提案したデータセットの有効性を評価します。
要約(オリジナル)
Automotive related datasets have previously been used for training autonomous driving systems or vehicle classification tasks. However, there is a lack of datasets in the field of automotive AI for car parts detection, and most available datasets are limited in size and scope, struggling to cover diverse scenarios. To address this gap, this paper presents a large-scale and fine-grained automotive dataset consisting of 84,162 images for detecting 12 different types of car parts. This dataset was collected from natural cameras and online websites which covers various car brands, scenarios, and shooting angles. To alleviate the burden of manual annotation, we propose a novel semi-supervised auto-labeling method that leverages state-of-the-art pre-trained detectors. Moreover, we study the limitations of the Grounding DINO approach for zero-shot labeling. Finally, we evaluate the effectiveness of our proposed dataset through fine-grained car parts detection by training several lightweight YOLO-series detectors.
arxiv情報
著者 | Wang Jie,Zhong Yilin,Cao Qianqian |
発行日 | 2023-11-20 13:30:42+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google