要約
自律システムの機能は急速に向上していますが、タスクを効果的かつ安全に実行することは依然として課題です。
パフォーマンスと安全性が競合する目標となる場合があるため、両者の間の最適化が困難になります。
考え方の 1 つは、この共最適化を、パフォーマンス指向の目的関数と安全性を制約とした制約付きの最適制御問題として扱うことです。
しかし、一般的な非線形システムに対するこの制約された最適制御問題を解決することは依然として困難です。
この作業では、制約付き最適制御の一般的なフレームワークを使用しますが、安全状態制約が与えられた場合、それを等価な制御制約に変換し、その結果、状態および時間依存の制御制約付き最適制御問題が生じます。
この同等の最適制御問題は、動的計画法原理を使用して容易に解決できます。
対応する値関数が特定のハミルトン・ヤコビ・ベルマン偏微分方程式 (HJB-PDE) の粘度解であることを示します。
さらに、二次元のケーススタディを使用して私たちの方法の有効性を実証し、実験では、私たちの方法を使用して合成されたコントローラーが安全性とパフォーマンスの両方でベースラインを常に上回っていることが示されています。
要約(オリジナル)
Autonomous systems have witnessed a rapid increase in their capabilities, but it remains a challenge for them to perform tasks both effectively and safely. The fact that performance and safety can sometimes be competing objectives renders the cooptimization between them difficult. One school of thought is to treat this cooptimization as a constrained optimal control problem with a performance-oriented objective function and safety as a constraint. However, solving this constrained optimal control problem for general nonlinear systems remains challenging. In this work, we use the general framework of constrained optimal control, but given the safety state constraint, we convert it into an equivalent control constraint, resulting in a state and time-dependent control-constrained optimal control problem. This equivalent optimal control problem can readily be solved using the dynamic programming principle. We show the corresponding value function is a viscosity solution of a certain Hamilton-Jacobi-Bellman Partial Differential Equation (HJB-PDE). Furthermore, we demonstrate the effectiveness of our method with a two-dimensional case study, and the experiment shows that the controller synthesized using our method consistently outperforms the baselines, both in safety and performance.
arxiv情報
著者 | Hao Wang,Adityaya Dhande,Somil Bansal |
発行日 | 2024-09-10 17:56:59+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google