Dynamic Simplex: Balancing Safety and Performance in Autonomous Cyber Physical Systems

要約

Learning Enabled Components (LEC) は、サイバーフィジカル システムがより高いレベルの自律性を達成するのを大いに支援してきました。
ただし、動的で不確実な動作条件に対する LEC の脆弱性は、これらのシステムの安全性にとって重大な課題です。
このような状況では、安全性を確保するために冗長コントローラ アーキテクチャが広く採用されています。
これらのアーキテクチャは、「安全」コントローラとそれらを切り替える決定ロジックで検証するのが難しいLEC「高性能」コントローラを強化します。
これらのアーキテクチャは安全性を保証しますが、2 つの制限を指摘します。
まず、システムの安全性を維持するコントローラーを常に選択するという保守的なポリシーを学習するために、オフラインでトレーニングされます。これにより、システムの動的および非定常環境への適応性が制限されます。
第 2 に、安全に対する脅威が存在しなくなった場合でも、セーフティ コントローラからパフォーマンス コントローラへのリバース スイッチングをサポートしていません。
これらの制限に対処するために、双方向の切り替えを可能にするオンラインコントローラー切り替えロジックを使用した動的シンプレックス戦略を提案します。
スイッチングを逐次的な意思決定の問題と見なし、セミマルコフの意思決定プロセスとしてモデル化します。
サロゲート モデルを使用する近視セレクター (順方向スイッチ用) と非近視性プランナー (逆方向スイッチ用) の組み合わせを活用して、安全性とパフォーマンスのバランスを取ります。
さまざまな運転条件、場所、およびコンポーネントの故障を使用して、CARLA シミュレーターで自動運転車のケース スタディを使用して、このアプローチを評価します。
提案されたアプローチにより、最先端の代替手段よりも衝突が少なくなり、パフォーマンスが向上することを示します。

要約(オリジナル)

Learning Enabled Components (LEC) have greatly assisted cyber-physical systems in achieving higher levels of autonomy. However, LEC’s susceptibility to dynamic and uncertain operating conditions is a critical challenge for the safety of these systems. Redundant controller architectures have been widely adopted for safety assurance in such contexts. These architectures augment LEC ‘performant’ controllers that are difficult to verify with ‘safety’ controllers and the decision logic to switch between them. While these architectures ensure safety, we point out two limitations. First, they are trained offline to learn a conservative policy of always selecting a controller that maintains the system’s safety, which limits the system’s adaptability to dynamic and non-stationary environments. Second, they do not support reverse switching from the safety controller to the performant controller, even when the threat to safety is no longer present. To address these limitations, we propose a dynamic simplex strategy with an online controller switching logic that allows two-way switching. We consider switching as a sequential decision-making problem and model it as a semi-Markov decision process. We leverage a combination of a myopic selector using surrogate models (for the forward switch) and a non-myopic planner (for the reverse switch) to balance safety and performance. We evaluate this approach using an autonomous vehicle case study in the CARLA simulator using different driving conditions, locations, and component failures. We show that the proposed approach results in fewer collisions and higher performance than state-of-the-art alternatives.

arxiv情報

著者 Baiting Luo,Shreyas Ramakrishna,Ava Pettet,Christopher Kuhn,Gabor Karsai,Ayan Mukhopadhyay
発行日 2023-02-20 04:00:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク