Task Generalization with Stability Guarantees via Elastic Dynamical System Motion Policies

要約

動的システム (DS) ベースのデモンストレーションからの学習 (LfD) により、いくつかの軌道からの安定性と収束が保証された反応性運動ポリシーの学習が可能になります。
しかし、現在の DS 学習手法は、基礎となる軌道を本質的に変更する明示的なタスク パラメーターを無視するため、新しいタスク インスタンスに一般化する柔軟性に欠けています。
この研究では、新しい DS 学習である Elastic-DS と、ガウス混合モデル (GMM) ベースの線形パラメーター変動 (LPV) DS 定式化にタスク パラメーターを埋め込む一般化アプローチを提案します。
私たちのアプローチの中心となるのは、SE(3) タスク関連フレームに制約された GMM である Elastic-GMM です。
新しいタスク インスタンス/コンテキストが与えられると、Elastic-GMM はラプラシアン編集で変換され、LPV-DS ポリシーの再推定に使用されます。
Elastic-DS は本質的に構成的なものであり、柔軟な複数ステップのタスクを構築するために使用できます。
私たちは、望ましい制御理論の保証を維持しながら、無数のシミュレーションおよび実際のロボット実験でその強みを実証します。
補足ビデオは https://sites.google.com/view/elastic-ds でご覧いただけます。

要約(オリジナル)

Dynamical System (DS) based Learning from Demonstration (LfD) allows learning of reactive motion policies with stability and convergence guarantees from a few trajectories. Yet, current DS learning techniques lack the flexibility to generalize to new task instances as they ignore explicit task parameters that inherently change the underlying trajectories. In this work, we propose Elastic-DS, a novel DS learning, and generalization approach that embeds task parameters into the Gaussian Mixture Model (GMM) based Linear Parameter Varying (LPV) DS formulation. Central to our approach is the Elastic-GMM, a GMM constrained to SE(3) task-relevant frames. Given a new task instance/context, the Elastic-GMM is transformed with Laplacian Editing and used to re-estimate the LPV-DS policy. Elastic-DS is compositional in nature and can be used to construct flexible multi-step tasks. We showcase its strength on a myriad of simulated and real-robot experiments while preserving desirable control-theoretic guarantees. Supplementary videos can be found at https://sites.google.com/view/elastic-ds

arxiv情報

著者 Tianyu Li,Nadia Figueroa
発行日 2023-09-05 01:22:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO, cs.SY, eess.SY パーマリンク