CLIPping the Limits: Finding the Sweet Spot for Relevant Images in Automated Driving Systems Perception Testing

要約

認識システム、特にカメラは自動運転システムの目となります。
したがって、それらが確実かつ堅牢に機能することを保証することは、車両の自動化における重要な構成要素です。
自動運転システムの認識をテストするにはさまざまなアプローチがあります。
しかし、最終的には、常に、特定の入力データの下での知覚システムの動作を調査することになります。
カメラ画像は入力データの重要な部分です。
したがって、自動運転システムのテストのために画像データ セットが収集されますが、これらのデータ セットから特定の画像を見つけることは簡単ではありません。
ニューラル ネットワークの最近の発展のおかげで、自然言語のプロンプトとの類似性に基づいてデータ セット内の画像を並べ替える方法が登場しました。
検索結果の提供をさらに自動化するために、これらの並べ替えられた結果のしきい値定義を自動化し、プロンプトに関連する画像のみを結果として返すことで貢献します。
私たちは、偽陽性と偽陰性を同等に防ぐことに重点を置いています。
また、私たちの方法が堅牢であること、そして私たちの仮定が満たされない場合にはフォールバック ソリューションを提供することも重要です。

要約(オリジナル)

Perception systems, especially cameras, are the eyes of automated driving systems. Ensuring that they function reliably and robustly is therefore an important building block in the automation of vehicles. There are various approaches to test the perception of automated driving systems. Ultimately, however, it always comes down to the investigation of the behavior of perception systems under specific input data. Camera images are a crucial part of the input data. Image data sets are therefore collected for the testing of automated driving systems, but it is non-trivial to find specific images in these data sets. Thanks to recent developments in neural networks, there are now methods for sorting the images in a data set according to their similarity to a prompt in natural language. In order to further automate the provision of search results, we make a contribution by automating the threshold definition in these sorted results and returning only the images relevant to the prompt as a result. Our focus is on preventing false positives and false negatives equally. It is also important that our method is robust and in the case that our assumptions are not fulfilled, we provide a fallback solution.

arxiv情報

著者 Philipp Rigoll,Laurenz Adolph,Lennart Ries,Eric Sax
発行日 2024-07-12 09:10:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク