Unveiling Objects with SOLA: An Annotation-Free Image Search on the Object Level for Automotive Data Sets

要約

膨大な画像データセットは、自動運転システムの認識を開発するための基礎となります。
多様な状況に対処できる堅牢なニューラル ネットワークをトレーニングするには、大量の画像が必要です。
十分に大きなデータセットには、困難な状況やオブジェクトが含まれています。
結果として得られる関数をテストするには、これらの状況とオブジェクトをデータ セットから見つけて抽出できる必要があります。
ラベルのない大量のデータを記録するのは比較的簡単ですが、要求の厳しい状況やオブジェクトを見つけるのははるかに困難です。
ただし、知覚システムの開発中は、長く時間のかかる注釈を実行することなく、困難なデータにアクセスできなければなりません。
したがって、開発者は、データ セット内の特定の状況やオブジェクトを動的に検索できなければなりません。
そこで、画像内で特定の特性を持つオブジェクトを検索するための、最先端のニューラル ネットワークに基づく方法を設計しました。
使いやすさを考慮して、この検索のクエリは自然言語を使用して記述されています。
時間の節約とパフォーマンスの向上を判断するために、自動車データセットに基づいてメソッドを定性的および定量的に評価しました。

要約(オリジナル)

Huge image data sets are the fundament for the development of the perception of automated driving systems. A large number of images is necessary to train robust neural networks that can cope with diverse situations. A sufficiently large data set contains challenging situations and objects. For testing the resulting functions, it is necessary that these situations and objects can be found and extracted from the data set. While it is relatively easy to record a large amount of unlabeled data, it is far more difficult to find demanding situations and objects. However, during the development of perception systems, it must be possible to access challenging data without having to perform lengthy and time-consuming annotations. A developer must therefore be able to search dynamically for specific situations and objects in a data set. Thus, we designed a method which is based on state-of-the-art neural networks to search for objects with certain properties within an image. For the ease of use, the query of this search is described using natural language. To determine the time savings and performance gains, we evaluated our method qualitatively and quantitatively on automotive data sets.

arxiv情報

著者 Philipp Rigoll,Jacob Langner,Eric Sax
発行日 2023-12-07 09:24:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク