PUMA: Deep Metric Imitation Learning for Stable Motion Primitives

要約

模倣学習 (IL) は、直感的なロボット プログラミングのための強力なテクニックです。
ただし、学習された行動の信頼性を確保することは依然として課題です。
モーションに到達するというコンテキストでは、ロボットは初期条件に関係なく、一貫して目標に到達する必要があります。
この要件を満たすために、IL メソッドでは多くの場合、構造上この特性を保証する特殊な関数近似器が使用されます。
これらのアプローチは効果的ではありますが、一連の制限があります。1) 最新のディープ ニューラル ネットワーク (DNN) アーキテクチャの機能を完全に活用することができません。2) モデル化できるモーション ファミリに制限があるものがあるため、最適化されていない IL が発生します。
3) 方向を考慮したモーションのジオメトリを考慮するために明示的な拡張が必要です。
これらの課題に対処するために、ディープメトリックラーニングの文献で使用される三重項損失からインスピレーションを得た、新しい安定性損失関数を導入します。
この損失は DNN のアーキテクチャを制約せず、正確な結果を生み出す学習ポリシーを可能にします。
さらに、特定の状態空間ジオメトリに制限されません。
したがって、ロボットの状態空間のジオメトリを簡単に組み込むことができます。
私たちは、この損失によって引き起こされる安定性特性の証明を提供し、さまざまな設定で私たちの方法を経験的に検証します。
これらの設定には、シミュレーションと実際のロボットの両方における、ユークリッド状態空間と非ユークリッド状態空間、および 1 次および 2 次の動作が含まれます。
実験結果の詳細については、https://youtu.be/ZWKLGntCI6w をご覧ください。

要約(オリジナル)

Imitation Learning (IL) is a powerful technique for intuitive robotic programming. However, ensuring the reliability of learned behaviors remains a challenge. In the context of reaching motions, a robot should consistently reach its goal, regardless of its initial conditions. To meet this requirement, IL methods often employ specialized function approximators that guarantee this property by construction. Although effective, these approaches come with a set of limitations: 1) they are unable to fully exploit the capabilities of modern Deep Neural Network (DNN) architectures, 2) some are restricted in the family of motions they can model, resulting in suboptimal IL capabilities, and 3) they require explicit extensions to account for the geometry of motions that consider orientations. To address these challenges, we introduce a novel stability loss function, drawing inspiration from the triplet loss used in the deep metric learning literature. This loss does not constrain the DNN’s architecture and enables learning policies that yield accurate results. Furthermore, it is not restricted to a specific state space geometry; therefore, it can easily incorporate the geometry of the robot’s state space. We provide a proof of the stability properties induced by this loss and empirically validate our method in various settings. These settings include Euclidean and non-Euclidean state spaces, as well as first-order and second-order motions, both in simulation and with real robots. More details about the experimental results can be found in: https://youtu.be/ZWKLGntCI6w.

arxiv情報

著者 Rodrigo Pérez-Dattari,Cosimo Della Santina,Jens Kober
発行日 2024-10-01 10:56:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク