Gradient-Based Trajectory Optimization With Learned Dynamics

要約

軌道最適化手法は、近年、現実世界のロボットで並外れたレベルのパフォーマンスを達成しています。
これらの方法は力学の正確な分析モデルに大きく依存していますが、物理世界の一部の側面は限られた範囲でしか捉えることができません。
別のアプローチは、機械学習技術を活用して、データからシステムの微分可能なダイナミクス モデルを学習することです。
この研究では、動力学の正確な分析モデルがない場合に、ロボット システムで非常に動的で複雑なタスクを実行するために、軌道の最適化とモデル学習を使用します。
我々は、ニューラル ネットワークが 2 つの異なるロボット ((i) ボストン ダイナミクス スポットと (ii) RC カー) のわずか 25 分間の対話で収集されたデータから、長期間にわたって高度に非線形な動作を正確にモデル化できることを示します。
さらに、ニューラル ネットワークの勾配を使用して、勾配ベースの軌道最適化を実行します。
ハードウェア実験では、学習したモデルがスポット カーとラジコン (RC) カーの両方の複雑なダイナミクスを表現でき、軌道最適化手法と組み合わせて優れたパフォーマンスを発揮できることを実証しました。

要約(オリジナル)

Trajectory optimization methods have achieved an exceptional level of performance on real-world robots in recent years. These methods heavily rely on accurate analytical models of the dynamics, yet some aspects of the physical world can only be captured to a limited extent. An alternative approach is to leverage machine learning techniques to learn a differentiable dynamics model of the system from data. In this work, we use trajectory optimization and model learning for performing highly dynamic and complex tasks with robotic systems in absence of accurate analytical models of the dynamics. We show that a neural network can model highly nonlinear behaviors accurately for large time horizons, from data collected in only 25 minutes of interactions on two distinct robots: (i) the Boston Dynamics Spot and an (ii) RC car. Furthermore, we use the gradients of the neural network to perform gradient-based trajectory optimization. In our hardware experiments, we demonstrate that our learned model can represent complex dynamics for both the Spot and Radio-controlled (RC) car, and gives good performance in combination with trajectory optimization methods.

arxiv情報

著者 Bhavya Sukhija,Nathanael Köhler,Miguel Zamora,Simon Zimmermann,Sebastian Curi,Andreas Krause,Stelian Coros
発行日 2023-06-25 16:40:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO パーマリンク