Learning to Refine Input Constrained Control Barrier Functions via Uncertainty-Aware Online Parameter Adaptation

要約

制御バリア関数(CBFS)は、非線形システムの安全性を確保するための強力なツールになりました。
ただし、持続的な安全性と実現可能性を保証する有効なCBFを見つけることは、特に入力制約を備えたシステムでは、オープンな課題のままです。
従来のアプローチは、多くの場合、CBF条件のクラスK関数のパラメーターを先験的に調整することに依存しています。
CBFベースのコントローラーのパフォーマンスは、これらの固定パラメーターに非常に敏感であり、過度に保守的な行動または安全違反につながる可能性があります。
これらの問題を克服するために、このペーパーでは、離散時間非線形システムにおける入力制約CBF(ICCBF)パラメーターのオンライン適応のための学習ベースの最適制御フレームワークを紹介します。
私たちの方法は、確率的アンサンブルニューラルネットワークを採用して、この作業で定義されているパフォーマンスとリスクメトリックを候補パラメーターについて予測し、認識論的不確実性とアレアトリック不確実性の両方を説明します。
有効なパラメーターを特定するために、リスクのあるジェンセン – レニイの発散と分布的に堅牢な条件付き値を使用した2段階の検証プロセスを提案します。
これにより、現在の状態および近くの環境に基づいてICCBFパラメーターの動的な改良性が可能になり、検証されたパラメーターセット内の安全性を確保しながらパフォーマンスを最適化できます。
実験結果は、私たちの方法が、安全性とパフォーマンスメトリック全体のロボットナビゲーションシナリオの固定パラメーターと既存の適応方法の両方を上回ることを示しています。

要約(オリジナル)

Control Barrier Functions (CBFs) have become powerful tools for ensuring safety in nonlinear systems. However, finding valid CBFs that guarantee persistent safety and feasibility remains an open challenge, especially in systems with input constraints. Traditional approaches often rely on manually tuning the parameters of the class K functions of the CBF conditions a priori. The performance of CBF-based controllers is highly sensitive to these fixed parameters, potentially leading to overly conservative behavior or safety violations. To overcome these issues, this paper introduces a learning-based optimal control framework for online adaptation of Input Constrained CBF (ICCBF) parameters in discrete-time nonlinear systems. Our method employs a probabilistic ensemble neural network to predict the performance and risk metrics, as defined in this work, for candidate parameters, accounting for both epistemic and aleatoric uncertainties. We propose a two-step verification process using Jensen-Renyi Divergence and distributionally-robust Conditional Value at Risk to identify valid parameters. This enables dynamic refinement of ICCBF parameters based on current state and nearby environments, optimizing performance while ensuring safety within the verified parameter set. Experimental results demonstrate that our method outperforms both fixed-parameter and existing adaptive methods in robot navigation scenarios across safety and performance metrics.

arxiv情報

著者 Taekyung Kim,Robin Inho Kee,Dimitra Panagou
発行日 2025-03-04 09:30:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY パーマリンク