Safe Imitation Learning of Nonlinear Model Predictive Control for Flexible Robots

要約

柔軟なロボットは、本質的に安全な人間とロボットのコラボレーションを可能にし、より高い積載量対質量比を達成するなど、業界の主要な課題のいくつかを克服する可能性があります。
ただし、柔軟なロボットの制御は、振動挙動や高次元の状態空間を含む複雑なダイナミクスのため複雑です。
非線形モデル予測制御 (NMPC) は、このようなロボットを制御する効果的な手段を提供しますが、その膨大な計算需要により、リアルタイム シナリオでの適用が制限されることがよくあります。
柔軟なロボットの高速制御を可能にするために、模倣学習と予測安全フィルターを使用した NMPC の安全な近似のフレームワークを提案します。
私たちのフレームワークは、パフォーマンスにわずかな損失をもたらしますが、計算時間を大幅に短縮します。
NMPC と比較して、当社のフレームワークは、安全上の制約を保証しながら、シミュレーションで 3 次元の柔軟なロボット アームを制御する際の計算時間が 8 倍以上改善されています。
特に、私たちのアプローチは最先端の強化学習手法を上回っています。
高速かつ安全な近似 NMPC の開発は、産業界での柔軟なロボットの導入を加速する可能性を秘めています。
プロジェクト コードは tinyurl.com/anmpc4fr から入手できます。

要約(オリジナル)

Flexible robots may overcome some of the industry’s major challenges, such as enabling intrinsically safe human-robot collaboration and achieving a higher payload-to-mass ratio. However, controlling flexible robots is complicated due to their complex dynamics, which include oscillatory behavior and a high-dimensional state space. Nonlinear model predictive control (NMPC) offers an effective means to control such robots, but its significant computational demand often limits its application in real-time scenarios. To enable fast control of flexible robots, we propose a framework for a safe approximation of NMPC using imitation learning and a predictive safety filter. Our framework significantly reduces computation time while incurring a slight loss in performance. Compared to NMPC, our framework shows more than an eightfold improvement in computation time when controlling a three-dimensional flexible robot arm in simulation, all while guaranteeing safety constraints. Notably, our approach outperforms state-of-the-art reinforcement learning methods. The development of fast and safe approximate NMPC holds the potential to accelerate the adoption of flexible robots in industry. The project code is available at: tinyurl.com/anmpc4fr

arxiv情報

著者 Shamil Mamedov,Rudolf Reiter,Seyed Mahdi Basiri Azad,Ruan Viljoen,Joschka Boedecker,Moritz Diehl,Jan Swevers
発行日 2024-08-14 20:40:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO, math.OC パーマリンク