Stochastic Trajectory Optimization for Demonstration Imitation

要約

人間は多くの場合、専門家の真似をし、徐々に熟練度を高めることによって新しいスキルを学びます。
この研究では、動的パフォーマンスを向上させてデモンストレーション軌道の形状を模倣するロボットの軌道最適化フレームワークである、デモンストレーション模倣のための確率的軌道最適化 (STODI) を紹介します。
人間の学習プロセスと一致して、デモンストレーションの模倣は最初のステップとして機能し、軌道の最適化はロボットの動作パフォーマンスを向上させることを目的としています。
STODI は、ランダム ノイズを生成し、適切なコスト関数を構築することにより、デモンストレーションの形状特性を維持しながら、生成されたノイズの多い軌道を効果的に探索して活用します。
デモンストレーションの模倣に役立つように、時間領域と周波数領域の両方で軌跡の類似性を測定する 3 つの指標を採用しています。
理論的分析により、これらの指標間の関係が明らかになり、特定のタスクに対する周波数領域分析の利点が強調されます。
PyBullet シミュレーターでの 7-DOF ロボット アームの実験では、STODI フレームワークの有効性を検証し、以前の方法と比較して最適化パフォーマンスと安定性が向上していることを示しています。

要約(オリジナル)

Humans often learn new skills by imitating the experts and gradually developing their proficiency. In this work, we introduce Stochastic Trajectory Optimization for Demonstration Imitation (STODI), a trajectory optimization framework for robots to imitate the shape of demonstration trajectories with improved dynamic performance. Consistent with the human learning process, demonstration imitation serves as an initial step, while trajectory optimization aims to enhance robot motion performance. By generating random noise and constructing proper cost functions, the STODI effectively explores and exploits generated noisy trajectories while preserving the demonstration shape characteristics. We employ three metrics to measure the similarity of trajectories in both the time and frequency domains to help with demonstration imitation. Theoretical analysis reveals relationships among these metrics, emphasizing the benefits of frequency-domain analysis for specific tasks. Experiments on a 7-DOF robotic arm in the PyBullet simulator validate the efficacy of the STODI framework, showcasing the improved optimization performance and stability compared to previous methods.

arxiv情報

著者 Chenlin Ming,Zitong Wang,Boxuan Zhang,Xiaoming Duan,Jianping He
発行日 2024-08-06 12:16:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY パーマリンク