Motion Manifold Flow Primitives for Language-Guided Trajectory Generation


最近の多様体学習ベースの手法は、次元性とデータセット サイズの問題に部分的に対処していますが、複雑なテキスト条件付き分布に苦労しています。
この論文では、少数のデモンストレーション軌跡データのみに依存しながら、3 つの課題すべてに対処しようとするテキストベースの軌跡生成モデルを提案します。
私たちの {\it Motion Manifold Flow Primitive (MMFP)} フレームワークが、幅広いテキスト入力に対して質的に異なるモーションを正確に生成でき、既存の手法を大幅に上回るパフォーマンスを示すことを示します。


Developing text-based robot trajectory generation models is made particularly difficult by the small dataset size, high dimensionality of the trajectory space, and the inherent complexity of the text-conditional motion distribution. Recent manifold learning-based methods have partially addressed the dimensionality and dataset size issues, but struggle with the complex text-conditional distribution. In this paper we propose a text-based trajectory generation model that attempts to address all three challenges while relying on only a handful of demonstration trajectory data. Our key idea is to leverage recent flow-based models capable of capturing complex conditional distributions, not directly in the high-dimensional trajectory space, but rather in the low-dimensional latent coordinate space of the motion manifold, with deliberately designed regularization terms to ensure smoothness of motions and robustness to text variations. We show that our {\it Motion Manifold Flow Primitive (MMFP)} framework can accurately generate qualitatively distinct motions for a wide range of text inputs, significantly outperforming existing methods.


著者 Yonghyeon Lee,Byeongho Lee,Seungyeon Kim,Frank C. Park
発行日 2024-07-29 03:53:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.RO パーマリンク