Manipulator as a Tail: Promoting Dynamic Stability for Legged Locomotion

要約

移動の場合、脚式ロボットのアームは移動にとって負債ですか、それとも資産ですか?
生物学的システムは、姿勢制御を容易にするために、脚以外にも追加の手足を進化させました。
この研究は、マニピュレータが高速での脚移動や外部摂動下での脚の移動にどのように役立つかを示しており、アームは操作を超えて機能します。
システムには 15 の自由度 (脚ロボットでは 12、腕では 3) があるため、既製の強化学習 (RL) アルゴリズムでは効果的な移動ポリシーを学習するのが困難です。
動物の運動学習に関するバーンスタインの神経生理学的理論に触発され、初期の学習手順からの行動クローニング (BC) を使用して、後の学習での最適化をガイドすることで、最初にある程度の自由度を固定し、徐々に自由度を解放する増分トレーニング手順を開発します。
シミュレーション実験では、私たちのポリシーが成功率をベースラインより最大 61 パーセントポイント増加させることが示されています。
シミュレーションと実際のロボット実験は、私たちのポリシーがアームを尻尾として使用してロボットの高速回転を開始し、外部摂動下で四足動物を安定させることを学習することを示唆しています。
定量的には、シミュレーション実験において、ロックアームを使用した場合と比較して、高速旋回時の故障率が最大43.6%、外力が加わった四脚の故障率が最大31.8%削減されました。

要約(オリジナル)

For locomotion, is an arm on a legged robot a liability or an asset for locomotion? Biological systems evolved additional limbs beyond legs that facilitates postural control. This work shows how a manipulator can be an asset for legged locomotion at high speeds or under external perturbations, where the arm serves beyond manipulation. Since the system has 15 degrees of freedom (twelve for the legged robot and three for the arm), off-the-shelf reinforcement learning (RL) algorithms struggle to learn effective locomotion policies. Inspired by Bernstein’s neurophysiological theory of animal motor learning, we develop an incremental training procedure that initially freezes some degrees of freedom and gradually releases them, using behaviour cloning (BC) from an early learning procedure to guide optimization in later learning. Simulation experiments show that our policy increases the success rate by up to 61 percentage points over the baselines. Simulation and real robot experiments suggest that our policy learns to use the arm as a tail to initiate robot turning at high speeds and to stabilize the quadruped under external perturbations. Quantitatively, in simulation experiments, we cut the failure rate up to 43.6% during high-speed turning and up to 31.8% for quadruped under external forces compared to using a locked arm.

arxiv情報

著者 Huang Huang,Antonio Loquercio,Ashish Kumar,Neerja Thakkar,Ken Goldberg,Jitendra Malik
発行日 2024-07-24 19:16:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク