Fast and Continual Learning for Hybrid Control Policies using Generalized Benders Decomposition

要約

連続変数と離散変数の両方を用いたハイブリッドモデル予測制御は、ロボット制御タスク、特に環境との接触を伴うタスクに広く適用できる。ハイブリッドMPCは組合せが複雑であるため、リアルタイムアプリケーションには解法速度が不十分な場合がある。本稿では、一般化ベンダース分解(GBD)に基づくハイブリッドMPCソルバーを提案する。このアルゴリズムは有限バッファ内に切断面をオンラインで列挙し保存する。短いコールドスタート段階の後、保存された切断面は新しい問題インスタンスに対してウォームスタートを提供し、解答速度を向上させる。外乱やランダムに変化する環境にもかかわらず、解法速度は維持される。また、実現可能性カットのスパース性を利用して、ベンダースマスター問題のための高速アルゴリズムを提案する。我々のソルバーは、ランダムに動く柔らかい接触壁を持つカートポールシステムと、障害物を回避しながら飛行するロボットの制御を通して検証された。その結果,Pythonのオーバーヘッドにもかかわらず,従来のソルバーよりも大幅に少ないデータ量で,市販のソルバーGurobiに匹敵する速度に到達した.

要約(オリジナル)

Hybrid model predictive control with both continuous and discrete variables is widely applicable to robotic control tasks, especially those involving contact with the environment. Due to the combinatorial complexity, the solving speed of hybrid MPC can be insufficient for real-time applications. In this paper, we proposed a hybrid MPC solver based on Generalized Benders Decomposition (GBD). The algorithm enumerates and stores cutting planes online inside a finite buffer. After a short cold-start phase, the stored cuts provide warm-starts for the new problem instances to enhance the solving speed. Despite the disturbance and randomly changing environment, the solving speed maintains. Leveraging on the sparsity of feasibility cuts, we also propose a fast algorithm for Benders master problems. Our solver is validated through controlling a cart-pole system with randomly moving soft contact walls, and a free-flying robot navigating around obstacles. The results show that with significantly less data than previous works, the solver reaches competitive speeds to the off-the-shelf solver Gurobi despite the Python overhead.

arxiv情報

著者 Xuan Lin
発行日 2024-01-04 08:52:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.RO パーマリンク