System-Level Safety Monitoring and Recovery for Perception Failures in Autonomous Vehicles

要約

自動運転車 (AV) の動作は安全性が重要であるため、コンポーネント レベルだけでなくシステム レベルで安全性を推論できる、タスク関連のアルゴリズムの開発が必要です。
システム全体のパフォーマンスに対する認識の失敗の影響を推論するには、このようなタスク関連のアルゴリズムは、AV スタックの複雑さ、動作環境の高い不確実性、リアルタイム パフォーマンスの必要性など、さまざまな課題に対処する必要があります。
これらの課題を克服するために、この研究では、計画アルゴリズムによって生成された計画の安全性を評価する、SPARQ (Perception And Recovery Q-network の安全性評価の略) と呼ばれる Q ネットワークを導入します。
プロセスが見落とされている可能性があります。
この Q ネットワークは、システムの実行時にクエリされて、提案された計画が実行しても安全かどうか、または潜在的な安全上のリスクがあるかどうかを評価できます。
違反が検出された場合、ネットワークは知覚上の失敗を考慮しながら修正計画を推奨できます。
NuPlan-Vegas データセットを使用してアルゴリズムを検証し、修正計画は安全なまま、認識の失敗により提案された計画が損なわれるケースを処理する能力を実証します。
目に見えないテスト データセットで 42 Hz の周波数を維持しながら、全体的な精度と再現率が 90% であることが観察されました。
私たちはパフォーマンスを一般的な到達可能性ベースのベースラインと比較し、AV パイプラインの安全性を向上させるアプローチのいくつかの興味深い特性を分析します。

要約(オリジナル)

The safety-critical nature of autonomous vehicle (AV) operation necessitates development of task-relevant algorithms that can reason about safety at the system level and not just at the component level. To reason about the impact of a perception failure on the entire system performance, such task-relevant algorithms must contend with various challenges: complexity of AV stacks, high uncertainty in the operating environments, and the need for real-time performance. To overcome these challenges, in this work, we introduce a Q-network called SPARQ (abbreviation for Safety evaluation for Perception And Recovery Q-network) that evaluates the safety of a plan generated by a planning algorithm, accounting for perception failures that the planning process may have overlooked. This Q-network can be queried during system runtime to assess whether a proposed plan is safe for execution or poses potential safety risks. If a violation is detected, the network can then recommend a corrective plan while accounting for the perceptual failure. We validate our algorithm using the NuPlan-Vegas dataset, demonstrating its ability to handle cases where a perception failure compromises a proposed plan while the corrective plan remains safe. We observe an overall accuracy and recall of 90% while sustaining a frequency of 42Hz on the unseen testing dataset. We compare our performance to a popular reachability-based baseline and analyze some interesting properties of our approach in improving the safety properties of an AV pipeline.

arxiv情報

著者 Kaustav Chakraborty,Zeyuan Feng,Sushant Veer,Apoorva Sharma,Boris Ivanovic,Marco Pavone,Somil Bansal
発行日 2024-09-26 08:25:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク