Safe Imitation Learning of Nonlinear Model Predictive Control for Flexible Robots

要約

柔軟なロボットは、本質的に安全な人間とロボットのコラボレーションを可能にし、より高い荷重対質量比を達成するなど、業界の主要な課題のいくつかを克服する可能性があります。
ただし、柔軟なロボットの制御は、振動挙動や高次元の状態空間を含む複雑なダイナミクスのため複雑です。
NMPC は、このようなロボットを制御する効果的な手段を提供しますが、その広範な計算要求により、リアルタイム シナリオでの適用が制限されることがよくあります。
柔軟なロボットの高速制御を可能にするために、模倣学習と予測安全フィルターを使用した NMPC の安全な近似のフレームワークを提案します。
私たちのフレームワークは、パフォーマンスにわずかな損失をもたらしますが、計算時間を大幅に短縮します。
NMPC と比較して、当社のフレームワークは、安全制約を保証しながら、シミュレーションで 3 次元の柔軟なロボット アームを制御する際の計算時間が 8 倍以上向上していることがわかります。
特に、私たちのアプローチは従来の強化学習方法よりも優れています。
高速かつ安全な近似 NMPC の開発は、産業界での柔軟なロボットの導入を加速する可能性を秘めています。

要約(オリジナル)

Flexible robots may overcome some of the industry’s major challenges, such as enabling intrinsically safe human-robot collaboration and achieving a higher load-to-mass ratio. However, controlling flexible robots is complicated due to their complex dynamics, which include oscillatory behavior and a high-dimensional state space. NMPC offers an effective means to control such robots, but its extensive computational demands often limit its application in real-time scenarios. To enable fast control of flexible robots, we propose a framework for a safe approximation of NMPC using imitation learning and a predictive safety filter. Our framework significantly reduces computation time while incurring a slight loss in performance. Compared to NMPC, our framework shows more than a eightfold improvement in computation time when controlling a three-dimensional flexible robot arm in simulation, all while guaranteeing safety constraints. Notably, our approach outperforms conventional reinforcement learning methods. The development of fast and safe approximate NMPC holds the potential to accelerate the adoption of flexible robots in industry.

arxiv情報

著者 Shamil Mamedov,Rudolf Reiter,Seyed Mahdi Basiri Azad,Joschka Boedecker,Moritz Diehl,Jan Swevers
発行日 2023-09-28 07:34:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO, math.OC パーマリンク