On the Optimality, Stability, and Feasibility of Control Barrier Functions: An Adaptive Learning-Based Approach

要約

タイトル:制御バリア関数の最適性、安定性、および実現可能性に関する:適応学習ベースのアプローチについて

要約:

– 安全性は、実世界のアプリケーションにおいて学習ベースのアプローチを展開する上で重要な問題である。
– 制御バリア関数(CBF)およびそのバリエーションは、安全性に関する制御において広く注目されてきた。
– 現在のCBFには、最適性、安定性、および実現可能性に関する根本的な制限がある。
– この論文では、Adaptive Multi-step Control Barrier Function(AM-CBF)という新しいアプローチを提案する。
– このアプローチでは、クラス-$\mathcal{K}$関数をニューラルネットワークでパラメータ化し、強化学習ポリシーと一緒にトレーニングする。
– マイオープの1ステップ性質を軽減するために、著者らは新しいマルチステップトレーニングとシングルステップ実行のパラダイムを提案する。
– このアプローチは、さまざまなシナリオで1次および2次システムで評価され、従来のCBFよりも質的にも量的にも優れた結果を示した。

要約(オリジナル)

Safety has been a critical issue for the deployment of learning-based approaches in real-world applications. To address this issue, control barrier function (CBF) and its variants have attracted extensive attention for safety-critical control. However, due to the myopic one-step nature of CBF and the lack of principled methods to design the class-$\mathcal{K}$ functions, there are still fundamental limitations of current CBFs: optimality, stability, and feasibility. In this paper, we proposed a novel and unified approach to address these limitations with Adaptive Multi-step Control Barrier Function (AM-CBF), where we parameterize the class-$\mathcal{K}$ function by a neural network and train it together with the reinforcement learning policy. Moreover, to mitigate the myopic nature, we propose a novel \textit{multi-step training and single-step execution} paradigm to make CBF farsighted while the execution remains solving a single-step convex quadratic program. Our method is evaluated on the first and second-order systems in various scenarios, where our approach outperforms the conventional CBF both qualitatively and quantitatively.

arxiv情報

著者 Alaa Eddine Chriat,Chuangchuang Sun
発行日 2023-05-05 15:11:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.LG, cs.RO, cs.SY, eess.SY, math.OC パーマリンク