要約
自律システムの能力は急速に向上しているが、タスクを効果的かつ安全に実行することは依然として難しい。性能と安全性は時として競合する目標になりうるため、両者の共適合は困難である。この共適応を、パフォーマンス指向の目的関数と安全性を制約条件とする制約付き最適制御問題として扱うという考え方がある。しかし、この制約付き最適制御問題を一般非線形システムに対して解くことは依然として困難である。本研究では、制約付き最適制御の一般的な枠組みを用いるが、安全状態制約が与えられた場合、それを等価制御制約に変換し、その結果、状態および時間に依存する制御制約付き最適制御問題を解く。この等価最適制御問題は、動的計画法の原理を用いて容易に解くことができる。対応する価値関数があるハミルトン-ヤコビ-ベルマン偏微分方程式(HJB-PDE)の粘性解であることを示す。さらに、本手法の有効性を2次元のケーススタディで実証し、本手法を用いて合成された制御器が、安全性と性能の両方において、常にベースラインを上回ることを実験で示す。
要約(オリジナル)
Autonomous systems have witnessed a rapid increase in their capabilities, but it remains a challenge for them to perform tasks both effectively and safely. The fact that performance and safety can sometimes be competing objectives renders the cooptimization between them difficult. One school of thought is to treat this cooptimization as a constrained optimal control problem with a performance-oriented objective function and safety as a constraint. However, solving this constrained optimal control problem for general nonlinear systems remains challenging. In this work, we use the general framework of constrained optimal control, but given the safety state constraint, we convert it into an equivalent control constraint, resulting in a state and time-dependent control-constrained optimal control problem. This equivalent optimal control problem can readily be solved using the dynamic programming principle. We show the corresponding value function is a viscosity solution of a certain Hamilton-Jacobi-Bellman Partial Differential Equation (HJB-PDE). Furthermore, we demonstrate the effectiveness of our method with a two-dimensional case study, and the experiment shows that the controller synthesized using our method consistently outperforms the baselines, both in safety and performance.
arxiv情報
著者 | Hao Wang,Adityaya Dhande,Somil Bansal |
発行日 | 2024-12-02 19:04:32+00:00 |
arxivサイト | arxiv_id(pdf) |