Approximate Optimal Controller Synthesis for Cart-Poles and Quadrotors via Sums-of-Squares

要約

二乗和 (SOS) 最適化は、非線形動的システム用の認定可能なコントローラーを合成するための有望なツールです。
以前の研究に基づいて、SOS が価値関数の適切な近似を見つけることによって、さまざまな過小作動ロボット システムに対して限界のある次善のパフォーマンスを備えた動的コントローラーを合成できることを実証します。
統合 SOS フレームワークを要約して、連続時間制御アフィン システムの値関数の過小近似と過大近似の両方を合成し、これらの近似を使用して近似最適コントローラーを生成し、
これらのコントローラー。
次に、接点を備えたハイブリッド システムを処理できるように定式化を拡張します。
私たちの方法は、低次の多項式を使用して値関数の厳密な過小近似と過大近似を生成できることを実証します。これは、倒立振子、カートポール、クアローターなどの連続時間システムの安定化コントローラーを提供するために使用されます。
ハイブリッド システム、平面プッシャーも備えています。
私たちの知る限り、SOS ベースの時不変コントローラーがカートのポールを振り上げて安定させ、平面スライダーを目的の姿勢に押すことができるのはこれが初めてです。

要約(オリジナル)

Sums-of-squares (SOS) optimization is a promising tool to synthesize certifiable controllers for nonlinear dynamical systems. Building upon prior works, we demonstrate that SOS can synthesize dynamic controllers with bounded suboptimal performance for various underactuated robotic systems by finding good approximations of the value function. We summarize a unified SOS framework to synthesize both under- and over- approximations of the value function for continuous-time, control-affine systems, use these approximations to generate approximate optimal controllers, and perform regional analysis on the closed-loop system driven by these controllers. We then extend the formulation to handle hybrid systems with contacts. We demonstrate that our method can generate tight under- and over- approximations of the value function with low-degree polynomials, which are used to provide stabilizing controllers for continuous-time systems including the inverted pendulum, the cart-pole, and the quadrotor as well as a hybrid system, the planar pusher. To the best of our knowledge, this is the first time that a SOS-based time-invariant controller can swing up and stabilize a cart-pole, and push the planar slider to the desired pose.

arxiv情報

著者 Lujie Yang,Hongkai Dai,Alexandre Amice,Russ Tedrake
発行日 2023-07-31 14:38:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク