Real-Time Safe Control of Neural Network Dynamic Models with Sound Approximation

要約

ニューラル ネットワーク ダイナミック モデル (NNDM) の安全な制御は、ロボット工学や多くのアプリケーションにとって重要です。
ただし、NNDM の最適な安全制御をリアルタイムで計算することは依然として困難です。
リアルタイム計算を可能にするために、制御合成で NNDM のサウンド近似を使用することを提案します。
特に、NNDM における ReLU 活性化関数のバーンスタイン多項式過近似 (BPO) に基づくバーンスタイン過近似ニューラル ダイナミクス (BOND) を提案します。
近似によって導入される誤差を軽減し、安全制御問題の永続的な実現可能性を確保するために、オフラインの NNDM の BPO 緩和内で最も危険な近似状態を使用して最悪の場合の安全性指標を合成します。
オンライン リアルタイム最適化では、高次の剰余に l2 有界バイアス項を使用した NNDM の追加線形層として、非線形の最悪の場合の安全性制約の一次テイラー近似を定式化します。
さまざまなニューラルダイナミクスと安全制約を使用した包括的な実験により、安全性が保証されている場合、サウンド近似を備えた当社の NNDM は、混合整数計画法 (MIP) を使用する安全制御ベースラインよりも 10 ~ 100 倍高速であることが示され、最悪の場合の安全性指標の有効性が検証されています。
リアルタイムの大規模設定における提案された BOND のスケーラビリティ。
コードは https://github.com/intelligent-control-lab/BOND で入手できます。

要約(オリジナル)

Safe control of neural network dynamic models (NNDMs) is important to robotics and many applications. However, it remains challenging to compute an optimal safe control in real time for NNDM. To enable real-time computation, we propose to use a sound approximation of the NNDM in the control synthesis. In particular, we propose Bernstein over-approximated neural dynamics (BOND) based on the Bernstein polynomial over-approximation (BPO) of ReLU activation functions in NNDM. To mitigate the errors introduced by the approximation and to ensure persistent feasibility of the safe control problems, we synthesize a worst-case safety index using the most unsafe approximated state within the BPO relaxation of NNDM offline. For the online real-time optimization, we formulate the first-order Taylor approximation of the nonlinear worst-case safety constraint as an additional linear layer of NNDM with the l2 bounded bias term for the higher-order remainder. Comprehensive experiments with different neural dynamics and safety constraints show that with safety guaranteed, our NNDMs with sound approximation are 10-100 times faster than the safe control baseline that uses mixed integer programming (MIP), validating the effectiveness of the worst-case safety index and scalability of the proposed BOND in real-time large-scale settings. The code is available at https://github.com/intelligent-control-lab/BOND.

arxiv情報

著者 Hanjiang Hu,Jianglin Lan,Changliu Liu
発行日 2024-05-20 21:57:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO, cs.SY, eess.SY パーマリンク