Fast and Continual Learning for Hybrid Control Policies using Generalized Benders Decomposition

要約

連続変数と離散変数の両方を使用したハイブリッド モデル予測制御は、ロボット制御タスク、特に環境との接触を伴うタスクに広く適用できます。
組み合わせの複雑さのため、ハイブリッド MPC の解決速度はリアルタイム アプリケーションには不十分な場合があります。
この論文では、一般化ベンダー分解 (GBD) に基づくハイブリッド MPC ソルバーを提案しました。
このアルゴリズムは、切断面をオンラインで列挙し、有限のバッファー内に保存します。
短いコールド スタート フェーズの後、保存されたカットによって新しい問題インスタンスのウォーム スタートが提供され、解決速度が向上します。
外乱やランダムに変化する環境にもかかわらず、解決速度は維持されます。
実現可能性カットのまばらさを利用して、ベンダーのマスター問題の高速アルゴリズムも提案します。
私たちのソルバーは、ランダムに動くソフトコンタクトウォールを備えたカートポールシステムと、障害物を避けて移動する自由飛行ロボットを制御することで検証されています。
結果は、以前の作品よりも大幅に少ないデータで、Python のオーバーヘッドにもかかわらず、ソルバーが既製のソルバー Gurobi に匹敵する速度に達していることを示しています。

要約(オリジナル)

Hybrid model predictive control with both continuous and discrete variables is widely applicable to robotic control tasks, especially those involving contact with the environment. Due to the combinatorial complexity, the solving speed of hybrid MPC can be insufficient for real-time applications. In this paper, we proposed a hybrid MPC solver based on Generalized Benders Decomposition (GBD). The algorithm enumerates and stores cutting planes online inside a finite buffer. After a short cold-start phase, the stored cuts provide warm-starts for the new problem instances to enhance the solving speed. Despite the disturbance and randomly changing environment, the solving speed maintains. Leveraging on the sparsity of feasibility cuts, we also propose a fast algorithm for Benders master problems. Our solver is validated through controlling a cart-pole system with randomly moving soft contact walls, and a free-flying robot navigating around obstacles. The results show that with significantly less data than previous works, the solver reaches competitive speeds to the off-the-shelf solver Gurobi despite the Python overhead.

arxiv情報

著者 Xuan Lin
発行日 2024-01-01 07:03:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク