要約
モデル予測制御は、ロボットが複雑な動きを生成するための一般的なツールとして浮上しています。
ただし、リアルタイムの要件により、安全性と安定性を確保するために必要なハード制約と大規模なプレビュー視野の使用が制限されています。
実際には、実務家は、無限の地平線の定式化を模倣できるコスト関数を慎重に設計する必要があります。
この作業では、値の反復と軌跡の最適化を使用して、ニューラルネットワークで制約された最適な制御問題の無限の地平線価値関数を概算する方法を研究します。
さらに、この値関数近似を端子コストとして使用すると、モデル予測コントローラーにグローバルな安定性がどのように提供されるかを示します。
このアプローチは、2つのおもちゃの問題と、価値関数が目標と障害に条件付けられている産業マニピュレーターのオンライン障害回避を伴う現実世界のシナリオで検証されています。
要約(オリジナル)
Model Predictive Control has emerged as a popular tool for robots to generate complex motions. However, the real-time requirement has limited the use of hard constraints and large preview horizons, which are necessary to ensure safety and stability. In practice, practitioners have to carefully design cost functions that can imitate an infinite horizon formulation, which is tedious and often results in local minima. In this work, we study how to approximate the infinite horizon value function of constrained optimal control problems with neural networks using value iteration and trajectory optimization. Furthermore, we demonstrate how using this value function approximation as a terminal cost provides global stability to the model predictive controller. The approach is validated on two toy problems and a real-world scenario with online obstacle avoidance on an industrial manipulator where the value function is conditioned to the goal and obstacle.
arxiv情報
著者 | Armand Jordana,Sébastien Kleff,Arthur Haffemayer,Joaquim Ortiz-Haro,Justin Carpentier,Nicolas Mansard,Ludovic Righetti |
発行日 | 2025-02-10 18:40:18+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google