ReLU-QP: A GPU-Accelerated Quadratic Programming Solver for Model-Predictive Control

要約

我々は、高次元の制御問題をリアルタイムで解決できる二次計画法 (QP) 用の GPU 高速ソルバーである ReLU-QP を紹介します。
ReLU-QP は、QP を整流線形単位 (ReLU) 活性化を備えた深い重み結合ニューラル ネットワークとして解決するための Alternating Direction Method of Multipliers (ADMM) アルゴリズムを正確に再定式化することによって導出されます。
この再定式化により、標準の機械学習ツールボックスを使用して GPU 上に ReLU-QP を展開できるようになります。
3 つのモデル予測制御 (MPC) ベンチマークにわたって ReLU-QP のパフォーマンスを評価します。制御限界によるランダム線形動的システムの安定化、片足での Atlas ヒューマノイド ロボットのバランス調整、および装備された四足歩行での全身基準軌道の追跡です。
6自由度アーム。
これらのベンチマークは、ReLU-QP が小規模から中規模の問題に対しては最先端の CPU ベースのソルバーと競合し、大規模な問題に対しては桁違いの速度向上を提供することを示しています。

要約(オリジナル)

We present ReLU-QP, a GPU-accelerated solver for quadratic programs (QPs) that is capable of solving high-dimensional control problems at real-time rates. ReLU-QP is derived by exactly reformulating the Alternating Direction Method of Multipliers (ADMM) algorithm for solving QPs as a deep, weight-tied neural network with rectified linear unit (ReLU) activations. This reformulation enables the deployment of ReLU-QP on GPUs using standard machine-learning toolboxes. We evaluate the performance of ReLU-QP across three model-predictive control (MPC) benchmarks: stabilizing random linear dynamical systems with control limits, balancing an Atlas humanoid robot on a single foot, and tracking whole-body reference trajectories on a quadruped equipped with a six-degree-of-freedom arm. These benchmarks indicate that ReLU-QP is competitive with state-of-the-art CPU-based solvers for small-to-medium-scale problems and offers order-of-magnitude speed improvements for larger-scale problems.

arxiv情報

著者 Arun L. Bishop,John Z. Zhang,Swaminathan Gurumurthy,Kevin Tracy,Zachary Manchester
発行日 2023-11-29 20:06:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク