A Data-Driven Model-Reference Adaptive Control Approach Based on Reinforcement Learning

要約

モデル参照適応システムは、植物が望ましい参照軌道を追跡するように導く技術のコンソーシアムを指します。
リアプノフ、滑り面、バックステッピングなどの理論に基づくアプローチは、通常、適応制御戦略をアドバイスするために使用されます。
結果として得られるソリューションは、参照モデルの複雑さと派生した制御戦略の複雑さによってしばしば挑戦されます。
さらに、プロセス ダイナミクスとリファレンス ダイナミカル モデルへの制御戦略の明示的な依存性は、不確実または未知のダイナミクスに直面した場合の効率の低下に寄与する可能性があります。
ここでは、エラーベースの構造のハミルトン-ヤコビ-ベルマン方程式を解く自律システム用のモデル参照適応ソリューションが開発されています。
提案されたアプローチは、積分時間差分方程式を使用してプロセスを記述し、積分強化学習メカニズムを使用してそれを解決します。
これは、制御戦略でプロセスまたは参照モデルのダイナミクスを認識したり採用したりすることなく、リアルタイムで行われます。
航空機のクラスは、提案された技術を検証するために採用されています。

要約(オリジナル)

Model-reference adaptive systems refer to a consortium of techniques that guide plants to track desired reference trajectories. Approaches based on theories like Lyapunov, sliding surfaces, and backstepping are typically employed to advise adaptive control strategies. The resulting solutions are often challenged by the complexity of the reference model and those of the derived control strategies. Additionally, the explicit dependence of the control strategies on the process dynamics and reference dynamical models may contribute in degrading their efficiency in the face of uncertain or unknown dynamics. A model-reference adaptive solution is developed here for autonomous systems where it solves the Hamilton-Jacobi-Bellman equation of an error-based structure. The proposed approach describes the process with an integral temporal difference equation and solves it using an integral reinforcement learning mechanism. This is done in real-time without knowing or employing the dynamics of either the process or reference model in the control strategies. A class of aircraft is adopted to validate the proposed technique.

arxiv情報

著者 Mohammed Abouheaf,Wail Gueaieb,Davide Spinello,Salah Al-Sharhan
発行日 2023-03-17 14:10:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO, cs.SY, eess.SY パーマリンク