Task-optimal data-driven surrogate models for eNMPC via differentiable simulation and optimization

要約

制御における最適なパフォーマンスを実現するために、Koopman サロゲート モデルをエンドツーエンドで学習する方法を紹介します。
標準的な強化学習 (RL) アルゴリズムを使用した以前の貢献とは対照的に、私たちは機械シミュレーション モデルに基づいた環境の潜在的な微分可能性を利用するトレーニング アルゴリズムを使用します。
文献で知られている eNMPC ケーススタディに基づいて、他のコントローラー タイプとトレーニング アルゴリズムの組み合わせのパフォーマンスと比較することで、このメソッドのパフォーマンスを評価します。
私たちの方法は、この問題に対して優れたパフォーマンスを示し、それにより、動的サロゲート モデルを使用する、より有能なコントローラーへの有望な手段を構成します。

要約(オリジナル)

We present a method for end-to-end learning of Koopman surrogate models for optimal performance in control. In contrast to previous contributions that employ standard reinforcement learning (RL) algorithms, we use a training algorithm that exploits the potential differentiability of environments based on mechanistic simulation models. We evaluate the performance of our method by comparing it to that of other controller type and training algorithm combinations on a literature known eNMPC case study. Our method exhibits superior performance on this problem, thereby constituting a promising avenue towards more capable controllers that employ dynamic surrogate models.

arxiv情報

著者 Daniel Mayfrank,Na Young Ahn,Alexander Mitsos,Manuel Dahmen
発行日 2024-03-21 14:28:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, math.OC パーマリンク