Optimizing Falsification for Learning-Based Control Systems: A Multi-Fidelity Bayesian Approach

要約

セーフティクリティカルなシステムのコントローラをテストすることは、安全性を確保し、故障を防ぐために不可欠です。
この論文では、シミュレーションを通じて学習ベースの閉ループ制御システム内の改ざん問題に取り組みます。
この問題には、システムの安全性要件に違反する反例の特定が含まれており、これらの要件に基づいて最適化タスクとして定式化できます。
この最適化問題で完全に忠実なシミュレータ データを使用すると、計算コストが高くなる可能性があります。
効率を向上させるために、さまざまな精度レベルのシミュレーターを利用する、多重忠実度のベイジアン最適化反証フレームワークを提案します。
私たちが提案するフレームワークは、異なるシミュレーター間を移行し、それらの間に意味のある関係を確立できます。
多重忠実度ベイジアン最適化を通じて、反例となる可能性が高い最適なシステム入力と、評価に適切な忠実度レベルの両方を決定します。
私たちは、それぞれ異なるレベルの忠実度を特徴とするさまざまなジム環境でアプローチを評価しました。
私たちの実験は、反例の検出において、多重忠実度ベイズ最適化が完全忠実ベイズ最適化や他のベースライン手法よりも計算効率が高いことを示しています。
このアルゴリズムの Python 実装は、https://github.com/SAILRIT/MFBO_Falsification で入手できます。

要約(オリジナル)

Testing controllers in safety-critical systems is vital for ensuring their safety and preventing failures. In this paper, we address the falsification problem within learning-based closed-loop control systems through simulation. This problem involves the identification of counterexamples that violate system safety requirements and can be formulated as an optimization task based on these requirements. Using full-fidelity simulator data in this optimization problem can be computationally expensive. To improve efficiency, we propose a multi-fidelity Bayesian optimization falsification framework that harnesses simulators with varying levels of accuracy. Our proposed framework can transition between different simulators and establish meaningful relationships between them. Through multi-fidelity Bayesian optimization, we determine both the optimal system input likely to be a counterexample and the appropriate fidelity level for assessment. We evaluated our approach across various Gym environments, each featuring different levels of fidelity. Our experiments demonstrate that multi-fidelity Bayesian optimization is more computationally efficient than full-fidelity Bayesian optimization and other baseline methods in detecting counterexamples. A Python implementation of the algorithm is available at https://github.com/SAILRIT/MFBO_Falsification.

arxiv情報

著者 Zahra Shahrooei,Mykel J. Kochenderfer,Ali Baheri
発行日 2024-09-12 14:51:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.SY, eess.SY パーマリンク