Learning to Hop for a Single-Legged Robot with Parallel Mechanism

要約

この研究では、並列メカニズムを備えた高度に動的ホッピング システムのパフォーマンスを向上させるための強化学習のアプリケーションを紹介します。
直列機構とは異なり、並列機構は運動学的制約と閉ループ構造が複雑であるため、正確にシミュレートすることができません。
さらに、ホップを学ぶには、空中フェーズが長くなり、報酬がまばらになるという問題があります。
これらに対処するために、長時間にわたる空中フェーズによってもたらされる作動不足を考慮して、長い歴史のフィードバックをエンコードする学習フレームワークを提案します。
提案されたフレームワークでは、トレーニング中に並列構造を直接シミュレートすることを避けるために、並列設計に簡略化されたシリアル構成も導入します。
トルクレベル変換は、パラレルシリアル変換を処理して、シミュレーションからリアルへの問題を処理するように設計されています。
このフレームワークを検証するために、シミュレーションとハードウェア実験が実施されました。

要約(オリジナル)

This work presents the application of reinforcement learning to improve the performance of a highly dynamic hopping system with a parallel mechanism. Unlike serial mechanisms, parallel mechanisms can not be accurately simulated due to the complexity of their kinematic constraints and closed-loop structures. Besides, learning to hop suffers from prolonged aerial phase and the sparse nature of the rewards. To address them, we propose a learning framework to encode long-history feedback to account for the under-actuation brought by the prolonged aerial phase. In the proposed framework, we also introduce a simplified serial configuration for the parallel design to avoid directly simulating parallel structure during the training. A torque-level conversion is designed to deal with the parallel-serial conversion to handle the sim-to-real issue. Simulation and hardware experiments have been conducted to validate this framework.

arxiv情報

著者 Hongbo Zhang,Xiangyu Chu,Yanlin Chen,Yunxi Tang,Linzhu Yue,Yun-Hui Liu,Kwok Wai Samuel Au
発行日 2025-01-21 07:41:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク