Learning More With Less: Sample Efficient Dynamics Learning and Model-Based RL for Loco-Manipulation

要約

脚のある移動の俊敏性を操作の機能と組み合わせて、局所操作プラットフォームは、実際のアプリケーションで複雑なタスクを実行する可能性があります。
この目的のために、ボストンダイナミクススポットなどのマニピュレーターが付いた最先端の四足動物が、有能で堅牢なプラットフォームを提供するために現れました。
ただし、局所操作制御の複雑さと、商用プラットフォームのブラックボックスの性質の両方が、正確なダイナミクスモデルと制御ポリシーを開発するための課題をもたらします。
これらの課題に対処します。四角腕のプラットフォームの手作りされた運動モデルを開発し、物理的事前層を使用したベイジアンニューラルネットワーク(BNN)ベースのダイナミクス学習の最近の進歩とともに、データから正確なダイナミクスモデルを効率的に学習します。
次に、モデルベースの強化学習(RL)を介して、遺伝子座操作の制御ポリシーを導き出します。
ボストンダイナミクススポットを使用してマニピュレーターを使用してハードウェアでこのアプローチの有効性を実証し、低データレジームでも動的なエンドエフェクターの軌跡追跡を正確に実行します。

要約(オリジナル)

Combining the agility of legged locomotion with the capabilities of manipulation, loco-manipulation platforms have the potential to perform complex tasks in real-world applications. To this end, state-of-the-art quadrupeds with attached manipulators, such as the Boston Dynamics Spot, have emerged to provide a capable and robust platform. However, both the complexity of loco-manipulation control, as well as the black-box nature of commercial platforms pose challenges for developing accurate dynamics models and control policies. We address these challenges by developing a hand-crafted kinematic model for a quadruped-with-arm platform and, together with recent advances in Bayesian Neural Network (BNN)-based dynamics learning using physical priors, efficiently learn an accurate dynamics model from data. We then derive control policies for loco-manipulation via model-based reinforcement learning (RL). We demonstrate the effectiveness of this approach on hardware using the Boston Dynamics Spot with a manipulator, accurately performing dynamic end-effector trajectory tracking even in low data regimes.

arxiv情報

著者 Benjamin Hoffman,Jin Cheng,Chenhao Li,Stelian Coros
発行日 2025-01-31 05:51:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク