要約
タイトル:制御バリア関数の最適性、安定性、および実現可能性に関する:適応学習ベースのアプローチについて
要約:
– 安全性は、実世界のアプリケーションにおいて学習ベースのアプローチを展開する上で重要な問題である。
– 制御バリア関数(CBF)およびそのバリエーションは、安全性に関する制御において広く注目されてきた。
– 現在のCBFには、最適性、安定性、および実現可能性に関する根本的な制限がある。
– この論文では、Adaptive Multi-step Control Barrier Function(AM-CBF)という新しいアプローチを提案する。
– このアプローチでは、クラス-$\mathcal{K}$関数をニューラルネットワークでパラメータ化し、強化学習ポリシーと一緒にトレーニングする。
– マイオープの1ステップ性質を軽減するために、著者らは新しいマルチステップトレーニングとシングルステップ実行のパラダイムを提案する。
– このアプローチは、さまざまなシナリオで1次および2次システムで評価され、従来のCBFよりも質的にも量的にも優れた結果を示した。
要約(オリジナル)
Safety has been a critical issue for the deployment of learning-based approaches in real-world applications. To address this issue, control barrier function (CBF) and its variants have attracted extensive attention for safety-critical control. However, due to the myopic one-step nature of CBF and the lack of principled methods to design the class-$\mathcal{K}$ functions, there are still fundamental limitations of current CBFs: optimality, stability, and feasibility. In this paper, we proposed a novel and unified approach to address these limitations with Adaptive Multi-step Control Barrier Function (AM-CBF), where we parameterize the class-$\mathcal{K}$ function by a neural network and train it together with the reinforcement learning policy. Moreover, to mitigate the myopic nature, we propose a novel \textit{multi-step training and single-step execution} paradigm to make CBF farsighted while the execution remains solving a single-step convex quadratic program. Our method is evaluated on the first and second-order systems in various scenarios, where our approach outperforms the conventional CBF both qualitatively and quantitatively.
arxiv情報
著者 | Alaa Eddine Chriat,Chuangchuang Sun |
発行日 | 2023-05-05 15:11:28+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, OpenAI