要約
ニューラル ネットワークは、最近、真のシステム ダイナミクスの近似モデルとして、データ駆動型制御のコンテキストで使用されることが増えています。
モデル予測制御 (MPC) は、ニューラル MPC 戦略につながるこの実践を採用しています。
これは、学習されたニューラル ネットワークが、学習されたモデルがシステムの真の動的モデルの正確な近似をカプセル化する方法で収束および一般化されているのかどうかという疑問を引き起こします。したがって、モデルベースの制御、特に外乱を受けたモデルベースの制御にとって信頼できる選択肢となるのです。
不確実なシステム。
これに取り組むために、学習したシステム モデルにモンテカルロ ドロップアウト手法を採用した、新しいサンプリング ベースのアンサンブル ニューラル MPC アルゴリズムである Dropout MPC を提案します。
閉ループは、軌道の最適化のために各タイムステップで同時に使用される予測コントローラーのアンサンブルに基づいています。
アンサンブルの各メンバーは、重み付け投票スキームに基づいて制御入力に影響を与えるため、学習されたシステム ダイナミクスのさまざまな実現を採用することで、設計によりニューラル制御の信頼性が高まります。
この方法のさらなる長所は、将来の不確実性を推定する方法を設計により提供し、慎重な制御につながることです。
この方法は一般に、第一原理から導出されたモデルが推測するのが難しい、複雑な力学を伴う不確実なシステムを目的としていますが、アプリケーションを紹介するために、実験室で実際のモバイルマニピュレータから収集したデータを利用し、提案されたアルゴリズムをナビゲーションに使用します。
シミュレーション中のロボット。
要約(オリジナル)
Neural networks are lately more and more often being used in the context of data-driven control, as an approximate model of the true system dynamics. Model Predictive Control (MPC) adopts this practise leading to neural MPC strategies. This raises a question of whether the trained neural network has converged and generalized in a way that the learned model encapsulates an accurate approximation of the true dynamic model of the system, thus making it a reliable choice for model-based control, especially for disturbed and uncertain systems. To tackle that, we propose Dropout MPC, a novel sampling-based ensemble neural MPC algorithm that employs the Monte-Carlo dropout technique on the learned system model. The closed loop is based on an ensemble of predictive controllers, that are used simultaneously at each time-step for trajectory optimization. Each member of the ensemble influences the control input, based on a weighted voting scheme, thus by employing different realizations of the learned system dynamics, neural control becomes more reliable by design. An additional strength of the method is that it offers by design a way to estimate future uncertainty, leading to cautious control. While the method aims in general at uncertain systems with complex dynamics, where models derived from first principles are hard to infer, to showcase the application we utilize data gathered in the laboratory from a real mobile manipulator and employ the proposed algorithm for the navigation of the robot in simulation.
arxiv情報
著者 | Spyridon Syntakas,Kostas Vlachos |
発行日 | 2024-06-04 17:15:25+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google