TimewarpVAE: Simultaneous Time-Warping and Representation Learning of Trajectories

要約

人間による軌道のデモンストレーションは、多くの機械学習の問題に対するトレーニング データの重要なソースです。
ただし、複雑なタスクに対する人間のデモンストレーション データを収集するのは難しいため、それらの軌跡の効率的な表現を学習することが困難になります。
器用な操作などの多くの問題では、軌道の正確なタイミングを空間パスの特性から考慮する必要があります。
この研究では、タイミング変動と空間変動の潜在要因の両方を同時に学習するためにダイナミック タイム ワーピング (DTW) を組み込んだ完全微分可能多様体学習アルゴリズムである TimewarpVAE を提案します。
TimewarpVAE アルゴリズムが適切な時間調整と、手書きデータセットとフォーク操作データセットの空間変化の意味のある表現をどのように学習するかを示します。
私たちの結果は、ベースラインアプローチよりも空間再構成テストエラーが低く、学習された低次元表現を使用して、意味的に意味のある新しい軌道を効率的に生成できます。
ロボット アームの新しい高速軌道を生成するアルゴリズムの有用性を実証します。

要約(オリジナル)

Human demonstrations of trajectories are an important source of training data for many machine learning problems. However, the difficulty of collecting human demonstration data for complex tasks makes learning efficient representations of those trajectories challenging. For many problems, such as for dexterous manipulation, the exact timings of the trajectories should be factored from their spatial path characteristics. In this work, we propose TimewarpVAE, a fully differentiable manifold-learning algorithm that incorporates Dynamic Time Warping (DTW) to simultaneously learn both timing variations and latent factors of spatial variation. We show how the TimewarpVAE algorithm learns appropriate time alignments and meaningful representations of spatial variations in handwriting and fork manipulation datasets. Our results have lower spatial reconstruction test error than baseline approaches and the learned low-dimensional representations can be used to efficiently generate semantically meaningful novel trajectories. We demonstrate the utility of our algorithm to generate novel high-speed trajectories for a robotic arm.

arxiv情報

著者 Travers Rhodes,Daniel D. Lee
発行日 2024-06-07 00:47:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO パーマリンク