要約
長い視野や不連続なシステムダイナミクスにわたって推論が必要であるため、連絡を介したロボット制御は困難です。
エアホッケーなどの非常にダイナミックなタスクには、アジャイルの動作がさらに必要であり、リアルタイムでの計画に対応する最適な制御問題を扱うことができます。
学習ベースのアプローチは、コンタクトを介してオフライン学習フェーズに計算上の高価な推論をシフトすることにより、この問題に対処します。
ただし、そのような制約に近接して動作する場合、運動学的および動的な制約の対象となる低レベルの運動ポリシーを学習することが困難になる可能性があります。
このペーパーでは、高レベルの接触計画のための確率的最適制御ポリシーと、低レベルの制約モーション計画のためのオンラインモデル予測制御の組み合わせを調査します。
私たちのシステムは、銀行のショットとロボットの運動学的構造を活用することにより、撮影の精度と結果として生じるパック速度のバランスを取ることを学びます。
提案されたフレームワークは、ロボットエアホッケーのシミュレートされたゲームと実世界の両方のゲームで、純粋に制御ベースの純粋に学習ベースのテクニックよりも優れていることを示しています。
要約(オリジナル)
Robot control through contact is challenging as it requires reasoning over long horizons and discontinuous system dynamics. Highly dynamic tasks such as Air Hockey additionally require agile behavior, making the corresponding optimal control problems intractable for planning in realtime. Learning-based approaches address this issue by shifting computationally expensive reasoning through contacts to an offline learning phase. However, learning low-level motor policies subject to kinematic and dynamic constraints can be challenging if operating in proximity to such constraints is desired. This paper explores the combination of distilling a stochastic optimal control policy for high-level contact planning and online model-predictive control for low-level constrained motion planning. Our system learns to balance shooting accuracy and resulting puck speed by leveraging bank shots and the robot’s kinematic structure. We show that the proposed framework outperforms purely control-based and purely learning-based techniques in both simulated and real-world games of Robot Air Hockey.
arxiv情報
著者 | Julius Jankowski,Ante Marić,Puze Liu,Davide Tateo,Jan Peters,Sylvain Calinon |
発行日 | 2025-05-16 12:10:22+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google