要約
テキストベースのロボット軌道生成モデルの開発は、データセットのサイズが小さいこと、軌道空間の高次元性、およびテキスト条件付き動作分布の固有の複雑さによって特に困難になります。
最近の多様体学習ベースの手法は、次元性とデータセット サイズの問題に部分的に対処していますが、複雑なテキスト条件付き分布に苦労しています。
この論文では、少数のデモンストレーション軌跡データのみに依存しながら、3 つの課題すべてに対処しようとするテキストベースの軌跡生成モデルを提案します。
私たちの重要なアイデアは、高次元の軌道空間では直接ではなく、運動多様体の低次元の潜在座標空間で、複雑な条件付き分布を捕捉できる最近のフローベースのモデルを活用し、意図的に設計された正則化項を使用して、
動きの滑らかさとテキストの変化に対する堅牢性。
私たちの {\it Motion Manifold Flow Primitive (MMFP)} フレームワークが、幅広いテキスト入力に対して質的に異なるモーションを正確に生成でき、既存の手法を大幅に上回るパフォーマンスを示すことを示します。
要約(オリジナル)
Developing text-based robot trajectory generation models is made particularly difficult by the small dataset size, high dimensionality of the trajectory space, and the inherent complexity of the text-conditional motion distribution. Recent manifold learning-based methods have partially addressed the dimensionality and dataset size issues, but struggle with the complex text-conditional distribution. In this paper we propose a text-based trajectory generation model that attempts to address all three challenges while relying on only a handful of demonstration trajectory data. Our key idea is to leverage recent flow-based models capable of capturing complex conditional distributions, not directly in the high-dimensional trajectory space, but rather in the low-dimensional latent coordinate space of the motion manifold, with deliberately designed regularization terms to ensure smoothness of motions and robustness to text variations. We show that our {\it Motion Manifold Flow Primitive (MMFP)} framework can accurately generate qualitatively distinct motions for a wide range of text inputs, significantly outperforming existing methods.
arxiv情報
著者 | Yonghyeon Lee,Byeongho Lee,Seungyeon Kim,Frank C. Park |
発行日 | 2024-07-29 03:53:14+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google