Unveiling Objects with SOLA: An Annotation-Free Image Search on the Object Level for Automotive Data Sets

要約

自動運転システムの知覚を開発するためには、膨大な画像データセットが基礎となる。多様な状況に対応できるロバストなニューラルネットワークを訓練するためには、大量の画像が必要である。十分に大きなデータセットには、困難な状況や対象が含まれている。得られた関数をテストするためには、これらの状況やオブジェクトをデータセットから見つけ、抽出することが必要である。大量のラベルなしデータを記録することは比較的容易であるが、困難な状況や対象を見つけることははるかに困難である。しかし、知覚システムの開発においては、長くて時間のかかるアノテーションを行わなくても、困難なデータにアクセスできなければなりません。従って、開発者は、データセット中の特定の状況やオブジェクトを動的に検索できなければならない。そこで我々は、画像内の特定の特性を持つオブジェクトを検索する、最先端のニューラルネットワークに基づく手法を設計した。使いやすいように、この検索のクエリは自然言語を使って記述される。時間の節約と性能の向上を決定するために、我々は自動車データセットで我々の方法を定性的、定量的に評価した。

要約(オリジナル)

Huge image data sets are the fundament for the development of the perception of automated driving systems. A large number of images is necessary to train robust neural networks that can cope with diverse situations. A sufficiently large data set contains challenging situations and objects. For testing the resulting functions, it is necessary that these situations and objects can be found and extracted from the data set. While it is relatively easy to record a large amount of unlabeled data, it is far more difficult to find demanding situations and objects. However, during the development of perception systems, it must be possible to access challenging data without having to perform lengthy and time-consuming annotations. A developer must therefore be able to search dynamically for specific situations and objects in a data set. Thus, we designed a method which is based on state-of-the-art neural networks to search for objects with certain properties within an image. For the ease of use, the query of this search is described using natural language. To determine the time savings and performance gains, we evaluated our method qualitatively and quantitatively on automotive data sets.

arxiv情報

著者 Philipp Rigoll,Jacob Langner,Eric Sax
発行日 2023-12-04 12:48:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, cs.RO パーマリンク