System-Level Safety Monitoring and Recovery for Perception Failures in Autonomous Vehicles


自動運転車 (AV) の動作は安全性が重要であるため、コンポーネント レベルだけでなくシステム レベルで安全性を推論できる、タスク関連のアルゴリズムの開発が必要です。
システム全体のパフォーマンスに対する認識の失敗の影響を推論するには、このようなタスク関連のアルゴリズムは、AV スタックの複雑さ、動作環境の高い不確実性、リアルタイム パフォーマンスの必要性など、さまざまな課題に対処する必要があります。
これらの課題を克服するために、この研究では、計画アルゴリズムによって生成された計画の安全性を評価する、SPARQ (Perception And Recovery Q-network の安全性評価の略) と呼ばれる Q ネットワークを導入します。
この Q ネットワークは、システムの実行時にクエリされて、提案された計画が実行しても安全かどうか、または潜在的な安全上のリスクがあるかどうかを評価できます。
NuPlan-Vegas データセットを使用してアルゴリズムを検証し、修正計画は安全なまま、認識の失敗により提案された計画が損なわれるケースを処理する能力を実証します。
目に見えないテスト データセットで 42 Hz の周波数を維持しながら、全体的な精度と再現率が 90% であることが観察されました。
私たちはパフォーマンスを一般的な到達可能性ベースのベースラインと比較し、AV パイプラインの安全性を向上させるアプローチのいくつかの興味深い特性を分析します。


The safety-critical nature of autonomous vehicle (AV) operation necessitates development of task-relevant algorithms that can reason about safety at the system level and not just at the component level. To reason about the impact of a perception failure on the entire system performance, such task-relevant algorithms must contend with various challenges: complexity of AV stacks, high uncertainty in the operating environments, and the need for real-time performance. To overcome these challenges, in this work, we introduce a Q-network called SPARQ (abbreviation for Safety evaluation for Perception And Recovery Q-network) that evaluates the safety of a plan generated by a planning algorithm, accounting for perception failures that the planning process may have overlooked. This Q-network can be queried during system runtime to assess whether a proposed plan is safe for execution or poses potential safety risks. If a violation is detected, the network can then recommend a corrective plan while accounting for the perceptual failure. We validate our algorithm using the NuPlan-Vegas dataset, demonstrating its ability to handle cases where a perception failure compromises a proposed plan while the corrective plan remains safe. We observe an overall accuracy and recall of 90% while sustaining a frequency of 42Hz on the unseen testing dataset. We compare our performance to a popular reachability-based baseline and analyze some interesting properties of our approach in improving the safety properties of an AV pipeline.


著者 Kaustav Chakraborty,Zeyuan Feng,Sushant Veer,Apoorva Sharma,Boris Ivanovic,Marco Pavone,Somil Bansal
発行日 2024-09-26 08:25:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.RO パーマリンク