Stable Motion Primitives via Imitation and Contrastive Learning

要約

人間から学ぶことで、専門家でなくても簡単にロボットをプログラミングできるようになり、複雑なロボット ソリューションの構築に必要なリソースを削減できます。
それにもかかわらず、このようなデータ駆動型のアプローチには、失敗や事故を回避するために重要な、学習した行動に関する保証を提供する能力が欠けていることがよくあります。
この作業では、ロボットが初期状態に関係なく、常に目標に到達する必要がある到達/ポイント ツー ポイント モーションに焦点を当てています。
これは、モーションを動的システムとしてモデル化し、それらがグローバルに漸近的に安定していることを確認することで実現できます。
したがって、ディープ ニューラル ネットワーク (DNN) をトレーニングするための新しい対照的学習損失を導入します。これは、模倣学習損失と一緒に使用すると、学習した動きに前述の安定性を強制します。
以前の研究とは異なり、私たちの方法は関数近似器の構造を制限しないため、任意の DNN で使用でき、複雑な動きを高精度で学習できます。
データセットと実際のロボットを使用して検証します。
前者の場合、モーションは 2 次元および 4 次元であり、1 次および 2 次の動的システムとしてモデル化されます。
後者では、モーションは 3、4、および 6 次元であり、1 次および 2 次であり、7DoF ロボット マニピュレーターをエンド エフェクター空間およびジョイント空間で制御するために使用されます。
実際の実験に関する詳細は、https://youtu.be/OM-2edHBRfc に記載されています。

要約(オリジナル)

Learning from humans allows non-experts to program robots with ease, lowering the resources required to build complex robotic solutions. Nevertheless, such data-driven approaches often lack the ability of providing guarantees regarding their learned behaviors, which is critical for avoiding failures and/or accidents. In this work, we focus on reaching/point-to-point motions, where robots must always reach their goal, independently of their initial state. This can be achieved by modeling motions as dynamical systems and ensuring that they are globally asymptotically stable. Hence, we introduce a novel Contrastive Learning loss for training Deep Neural Networks (DNN) that, when used together with an Imitation Learning loss, enforces the aforementioned stability in the learned motions. Differently from previous work, our method does not restrict the structure of its function approximator, enabling its use with arbitrary DNNs and allowing it to learn complex motions with high accuracy. We validate it using datasets and a real robot. In the former case, motions are 2 and 4 dimensional, modeled as first and second order dynamical systems. In the latter, motions are 3, 4, and 6 dimensional, of first and second order, and are used to control a 7DoF robot manipulator in its end effector space and joint space. More details regarding the real-world experiments are presented in: https://youtu.be/OM-2edHBRfc.

arxiv情報

著者 Rodrigo Pérez-Dattari,Jens Kober
発行日 2023-02-20 14:49:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク