Neighboring Extremal Optimal Control Theory for Parameter-Dependent Closed-loop Laws

要約

この研究では、閉ループ最適制御問題に対する隣接極値最適制御 (NEOC) 解を取得するアプローチを紹介します。この解は、必ずしも 2 次の性能指数ではなく、幅広い非線形システムに適用できます。
このアプローチには、システム方程式または性能指数における既知のパラメーターの小さな変動により、既知の閉ループ最適制御則の関数形式に生じる変動を調査することが含まれます。
NEOC 解は、非線形のハミルトン-ヤコビ方程式の反復解で遭遇するものと同様の、線形偏微分方程式を解くことによって形式的に取得できます。
これら後者の方程式を解くための数値的手順を動機として、元の最適制御問題の基礎となるハミルトン・ヤコビ方程式を解くために基底関数の使用を活用する、Galerkin アルゴリズムに基づく数値アルゴリズムも提案します。
提案されたアプローチは、NEOC 問題を単純な一次方程式の解に還元することで簡素化し、それによって調整された最適制御問題の完全な解像度の必要性を排除します。
さらに、最適な性能指標への変化は、システム状態とパラメータの小さな変化の両方の関数として取得できるため、システム内のパラメータまたは性能指標をわずかに調整するだけで、最適な制御則への調整を決定できます。

さらに、既知の大きなパラメータの摂動を処理するために、NEOC の単一計算を複数のステップの有限セットに分割するホモトピック アプローチを提案します。
最後に、主張と理論の正当性は、理論分析と数値シミュレーションによって裏付けられます。

要約(オリジナル)

This study introduces an approach to obtain a neighboring extremal optimal control (NEOC) solution for a closed-loop optimal control problem, applicable to a wide array of nonlinear systems and not necessarily quadratic performance indices. The approach involves investigating the variation incurred in the functional form of a known closed-loop optimal control law due to small, known parameter variations in the system equations or the performance index. The NEOC solution can formally be obtained by solving a linear partial differential equation, akin to those encountered in the iterative solution of a nonlinear Hamilton-Jacobi equation. Motivated by numerical procedures for solving these latter equations, we also propose a numerical algorithm based on the Galerkin algorithm, leveraging the use of basis functions to solve the underlying Hamilton-Jacobi equation of the original optimal control problem. The proposed approach simplifies the NEOC problem by reducing it to the solution of a simple set of linear equations, thereby eliminating the need for a full re-solution of the adjusted optimal control problem. Furthermore, the variation to the optimal performance index can be obtained as a function of both the system state and small changes in parameters, allowing the determination of the adjustment to an optimal control law given a small adjustment of parameters in the system or the performance index. Moreover, in order to handle large known parameter perturbations, we propose a homotopic approach that breaks down the single calculation of NEOC into a finite set of multiple steps. Finally, the validity of the claims and theory is supported by theoretical analysis and numerical simulations.

arxiv情報

著者 Ayush Rai,Shaoshuai Mou,Brian D. O. Anderson
発行日 2023-12-07 22:27:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY, math.OC パーマリンク