Agile Catching with Whole-Body MPC and Blackbox Policy Learning

要約

私たちは、高速で投げられた物体をキャッチするという、アジャイル ロボット工学のベンチマーク タスクに取り組みます。
これは、投げられた物体の追跡、捕捉、揺りかごを伴う難しいタスクであり、その物体の視覚的観察とロボットの固有受容状態の確認のみがすべて 1 秒以内に行われます。
根本的に異なる 2 つの解決策、(i) 加速された制約付き軌道最適化を使用したモデル予測制御、および (ii) 0 次最適化を使用した強化学習の相対的な利点を示します。
当社は、広範なオンハードウェア実験を通じて、サンプル効率、シミュレーションからリアルへの転送、分布の変化に対する堅牢性、全身マルチモダリティなど、さまざまなパフォーマンスのトレードオフに関する洞察を提供します。
最後に、アジャイルなロボット制御のための「古典的」技術と「学習ベース」技術の融合に関する提案で終わります。
実験のビデオは https://sites.google.com/view/agile-getting でご覧いただけます。

要約(オリジナル)

We address a benchmark task in agile robotics: catching objects thrown at high-speed. This is a challenging task that involves tracking, intercepting, and cradling a thrown object with access only to visual observations of the object and the proprioceptive state of the robot, all within a fraction of a second. We present the relative merits of two fundamentally different solution strategies: (i) Model Predictive Control using accelerated constrained trajectory optimization, and (ii) Reinforcement Learning using zeroth-order optimization. We provide insights into various performance trade-offs including sample efficiency, sim-to-real transfer, robustness to distribution shifts, and whole-body multimodality via extensive on-hardware experiments. We conclude with proposals on fusing ‘classical’ and ‘learning-based’ techniques for agile robot control. Videos of our experiments may be found at https://sites.google.com/view/agile-catching

arxiv情報

著者 Saminda Abeyruwan,Alex Bewley,Nicholas M. Boffi,Krzysztof Choromanski,David D’Ambrosio,Deepali Jain,Pannag Sanketi,Anish Shankar,Vikas Sindhwani,Sumeet Singh,Jean-Jacques Slotine,Stephen Tu
発行日 2023-10-19 20:31:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク