FRASA: An End-to-End Reinforcement Learning Agent for Fall Recovery and Stand Up of Humanoid Robots

要約

ヒューマノイドロボット工学は、動的な環境で安定した移動を実現し、転倒から回復するという大きな課題に直面しています。
モデル予測制御 (MPC) やキー フレーム ベース (KFB) ルーチンなどの従来の方法では、広範な微調整が必​​要か、リアルタイムの適応性に欠けています。
このペーパーでは、転倒時の回復戦略と立ち上がり戦略を統合フレームワークに統合する深層強化学習 (DRL) エージェントである FRASA を紹介します。
Cross-Q アルゴリズムを活用することで、FRASA はトレーニング時間を大幅に短縮し、予測不可能な外乱に適応する多用途の回復戦略を提供します。
シグマバン ヒューマノイド ロボットの比較テストでは、キッドサイズ リーグの世界チャンピオンであるローバン チームがロボカップ 2023 で導入した KFB 方式に対して FRASA の優れたパフォーマンスが実証されました。

要約(オリジナル)

Humanoid robotics faces significant challenges in achieving stable locomotion and recovering from falls in dynamic environments. Traditional methods, such as Model Predictive Control (MPC) and Key Frame Based (KFB) routines, either require extensive fine-tuning or lack real-time adaptability. This paper introduces FRASA, a Deep Reinforcement Learning (DRL) agent that integrates fall recovery and stand up strategies into a unified framework. Leveraging the Cross-Q algorithm, FRASA significantly reduces training time and offers a versatile recovery strategy that adapts to unpredictable disturbances. Comparative tests on Sigmaban humanoid robots demonstrate FRASA superior performance against the KFB method deployed in the RoboCup 2023 by the Rhoban Team, world champion of the KidSize League.

arxiv情報

著者 Clément Gaspard,Marc Duclusaud,Grégoire Passault,Mélodie Daniel,Olivier Ly
発行日 2024-10-11 09:27:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク