要約
コントロール バリア関数 (CBF) は、任意の入力に対する非線形動的システムの安全性を保証する安全フィルターとして普及しています。
ただし、入力制約のある高相対次数システムの CBF 制約を満たす関数を構築することは困難です。
これらの課題に対処するために、最近の研究では、ニューラル CBF (NCBF) を介したニューラル ネットワークを使用した CBF の学習が検討されています。
ただし、このような方法は、入力制約の下で高次元システムにスケーリングするときに困難に直面します。
この研究では、まず NCBF がトレーニング中に直面する課題を特定します。
次に、これらの課題に対処するために、名目政策の価値関数を学習して CBF を構築する方法である政策ニューラル CBF (PNCBF) を提案し、最大経時コストの価値関数が CBF であることを示します。
私たちは、おもちゃの線形システムから 16 次元の状態空間を持つ F-16 ジェット機に至るまで、さまざまなシステムのシミュレーションでこの方法の有効性を実証します。
最後に、厳しい入力制約の下で、ハードウェア上の 2 エージェント クアッドコプター システムに対するアプローチを検証します。
要約(オリジナル)
Control barrier functions (CBFs) have become popular as a safety filter to guarantee the safety of nonlinear dynamical systems for arbitrary inputs. However, it is difficult to construct functions that satisfy the CBF constraints for high relative degree systems with input constraints. To address these challenges, recent work has explored learning CBFs using neural networks via neural CBFs (NCBFs). However, such methods face difficulties when scaling to higher dimensional systems under input constraints. In this work, we first identify challenges that NCBFs face during training. Next, to address these challenges, we propose policy neural CBFs (PNCBFs), a method of constructing CBFs by learning the value function of a nominal policy, and show that the value function of the maximum-over-time cost is a CBF. We demonstrate the effectiveness of our method in simulation on a variety of systems ranging from toy linear systems to an F-16 jet with a 16-dimensional state space. Finally, we validate our approach on a two-agent quadcopter system on hardware under tight input constraints.
arxiv情報
著者 | Oswin So,Zachary Serlin,Makai Mann,Jake Gonzales,Kwesi Rutledge,Nicholas Roy,Chuchu Fan |
発行日 | 2023-10-24 03:15:15+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google