Learning Lyapunov-Stable Polynomial Dynamical Systems Through Imitation

要約

模倣学習は、専門家の行動を模倣するためのポリシーを学習することで、複雑な動作計画の問題に対処するパラダイムです。
ただし、専門家のデータのみに依存すると、ロボットが実証された軌道から逸脱したときに危険な動作が発生する可能性があります。
安定性の保証は、これまで、リアプノフの安定定理と組み合わせて、高レベルの動作プランナーとして機能する非線形力学システムを利用して提供されてきました。
しかし、これらの方法は、複雑で非線形性の高い軌道を複製する際に、不正確なポリシー、高い計算コスト、サンプルの非効率性、または準安定性が発生する傾向があります。
この問題を軽減するために、運動計画ポリシーとして大域的に安定した非線形力学システムを学習するアプローチを提案します。
非線形力学システムをパラメトリック多項式としてモデル化し、リアプノフ候補と共同して多項式の係数を学習します。
その成功を示すために、私たちの手法を最先端のシミュレーションと比較し、Kinova Gen3 Lite マニピュレーター アームを使用して現実世界の実験を行います。
私たちの実験は、摂動に直面しても安定を保ちながら、さまざまな専門家による軌道に対する私たちの方法のサンプル効率と再現精度を実証しています。

要約(オリジナル)

Imitation learning is a paradigm to address complex motion planning problems by learning a policy to imitate an expert’s behavior. However, relying solely on the expert’s data might lead to unsafe actions when the robot deviates from the demonstrated trajectories. Stability guarantees have previously been provided utilizing nonlinear dynamical systems, acting as high-level motion planners, in conjunction with the Lyapunov stability theorem. Yet, these methods are prone to inaccurate policies, high computational cost, sample inefficiency, or quasi stability when replicating complex and highly nonlinear trajectories. To mitigate this problem, we present an approach for learning a globally stable nonlinear dynamical system as a motion planning policy. We model the nonlinear dynamical system as a parametric polynomial and learn the polynomial’s coefficients jointly with a Lyapunov candidate. To showcase its success, we compare our method against the state of the art in simulation and conduct real-world experiments with the Kinova Gen3 Lite manipulator arm. Our experiments demonstrate the sample efficiency and reproduction accuracy of our method for various expert trajectories, while remaining stable in the face of perturbations.

arxiv情報

著者 Amin Abyaneh,Hsiu-Chin Lin
発行日 2023-10-31 16:39:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY パーマリンク