Quattro: Transformer-Accelerated Iterative Linear Quadratic Regulator Framework for Fast Trajectory Optimization

要約

リアルタイムの最適制御は、特に厳しいパフォーマンス要件を備えた非線形システムのロボット工学における根本的な課題のままです。
代表的な軌道最適化アルゴリズムの1つとして、反復線形二次レギュレーター(ILQR)は、ロボットシステムのリアルタイム制御の効率と適用性を制限する本質的に順次計算性のために制限に直面します。
既存の並列実装は、上記の制限を克服することを目的としていますが、通常、追加の計算反復と高性能ハードウェアを要求し、実用的な改善のみにつながります。
このホワイトペーパーでは、アルゴリズムハードウェアの共同設計戦略を使用して、中間フィードバックとフィードフォワードマトリックスを予測するためのアルゴリズムハードウェアの共同設計戦略を採用したトランスアクセラレーションのILQRフレームワークであるQuattroを紹介します。
精度を犠牲にすることなく、リソース制約のデバイスで効果的な並列計算を容易にします。
カートポールおよび四肢システムの実験は、それぞれ1回の反復あたり5.3 $ \ Times $ $ $ $ $ $ $ $ $のアルゴリズムレベルの加速を示しています。
モデル予測制御(MPC)フレームワークに統合された場合、Quattroは、従来のILQRを適用したものと比較して、カートポールの全体的なスピードアップと四肢装置の17.8 $ \ Times $の全体的なスピードアップを達成します。
トランスの推論はFPGAに展開され、パフォーマンスを最大化し、一般的に使用されるコンピューティングデバイスで最大27.3 $ \ Times $のスピードアップを達成し、約2〜4 $ \ Times $の電力削減と許容可能なハードウェアオーバーヘッドを獲得します。

要約(オリジナル)

Real-time optimal control remains a fundamental challenge in robotics, especially for nonlinear systems with stringent performance requirements. As one of the representative trajectory optimization algorithms, the iterative Linear Quadratic Regulator (iLQR) faces limitations due to their inherently sequential computational nature, which restricts the efficiency and applicability of real-time control for robotic systems. While existing parallel implementations aim to overcome the above limitations, they typically demand additional computational iterations and high-performance hardware, leading to only modest practical improvements. In this paper, we introduce Quattro, a transformer-accelerated iLQR framework employing an algorithm-hardware co-design strategy to predict intermediate feedback and feedforward matrices. It facilitates effective parallel computations on resource-constrained devices without sacrificing accuracy. Experiments on cart-pole and quadrotor systems show an algorithm-level acceleration of up to 5.3$\times$ and 27$\times$ per iteration, respectively. When integrated into a Model Predictive Control (MPC) framework, Quattro achieves overall speedups of 2.8$\times$ for the cart-pole and 17.8$\times$ for the quadrotor compared to the one that applies traditional iLQR. Transformer inference is deployed on FPGA to maximize performance, achieving up to 27.3$\times$ speedup over commonly used computing devices, with around 2 to 4$\times$ power reduction and acceptable hardware overhead.

arxiv情報

著者 Yue Wang,Hoayu Wang,Zhaoxing Li
発行日 2025-04-02 15:12:18+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY パーマリンク