Stable Motion Primitives via Imitation and Contrastive Learning

要約

人間から学ぶことで、専門家でなくてもロボットを簡単にプログラミングできるようになり、複雑なロボット ソリューションの構築に必要なリソースが削減されます。
それにもかかわらず、そのようなデータ駆動型のアプローチには、失敗や事故を回避するために重要な、学習した動作に関する保証を提供する機能が欠けていることがよくあります。
この研究では、ロボットが初期状態とは無関係に常に目標に到達する必要がある、到達/ポイントツーポイントの動作に焦点を当てます。
これは、動きを動的システムとしてモデル化し、それらが全体的に漸近的に安定していることを保証することによって実現できます。
したがって、ディープ ニューラル ネットワーク (DNN) をトレーニングするための新しい対照学習損失を導入します。これを模倣学習損失と併用すると、学習されたモーションに前述の安定性が強制されます。
これまでの研究とは異なり、私たちの手法は関数近似器の構造を制限していないため、任意の DNN での使用が可能であり、複雑な動きを高精度に学習することができます。
データセットと実際のロボットを使用して検証します。
前者の場合、動きは 2 次元および 4 次元であり、1 次および 2 次の力学システムとしてモデル化されます。
後者では、モーションは 3、4、および 6 次元の 1 次および 2 次であり、エンド エフェクター空間と関節空間で 7DoF ロボット マニピュレーターを制御するために使用されます。
実際の実験の詳細については、\url{https://youtu.be/OM-2edHBRfc} をご覧ください。

要約(オリジナル)

Learning from humans allows non-experts to program robots with ease, lowering the resources required to build complex robotic solutions. Nevertheless, such data-driven approaches often lack the ability to provide guarantees regarding their learned behaviors, which is critical for avoiding failures and/or accidents. In this work, we focus on reaching/point-to-point motions, where robots must always reach their goal, independently of their initial state. This can be achieved by modeling motions as dynamical systems and ensuring that they are globally asymptotically stable. Hence, we introduce a novel Contrastive Learning loss for training Deep Neural Networks (DNN) that, when used together with an Imitation Learning loss, enforces the aforementioned stability in the learned motions. Differently from previous work, our method does not restrict the structure of its function approximator, enabling its use with arbitrary DNNs and allowing it to learn complex motions with high accuracy. We validate it using datasets and a real robot. In the former case, motions are 2 and 4 dimensional, modeled as first- and second-order dynamical systems. In the latter, motions are 3, 4, and 6 dimensional, of first and second order, and are used to control a 7DoF robot manipulator in its end effector space and joint space. More details regarding the real-world experiments are presented in: \url{https://youtu.be/OM-2edHBRfc}.

arxiv情報

著者 Rodrigo Pérez-Dattari,Jens Kober
発行日 2023-06-29 08:01:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク