Training Directional Locomotion for Quadrupedal Low-Cost Robotic Systems via Deep Reinforcement Learning

要約

この作業では、現実の世界の低コスト四足動物ロボットの方向移動のディープ補強学習(DRL)トレーニングを紹介します。
特に、ロボットは、前方移動とコース調整の両方を学習するのに最も役立つアクションステートの移行の調査を促進するために、ロボットが従わなければならない見出しのランダム化を活用します。
エピソードの見出しを現在のヨーにリセットすることに加えて、正規分布から描かれたランダムな値は、両方向に頻繁にターンを含む複雑な軌跡に従うことができるポリシーを生成します。
見出しを繰り返し変更することにより、この方法はロボットをトレーニングプラットフォーム内で動かし続け、したがって、トレーニング中に人間の関与と手動リセットの必要性を減らします。
カスタムで構築された低コストの四足動物での現実世界の実験は、ロボットがすべての検証テストを正常にナビゲートすることで、私たちの方法の有効性を示しています。
他のアプローチで訓練された場合、ロボットは前方移動テストでのみ成功し、ターニングが必要なときに失敗します。

要約(オリジナル)

In this work we present Deep Reinforcement Learning (DRL) training of directional locomotion for low-cost quadrupedal robots in the real world. In particular, we exploit randomization of heading that the robot must follow to foster exploration of action-state transitions most useful for learning both forward locomotion as well as course adjustments. Changing the heading in episode resets to current yaw plus a random value drawn from a normal distribution yields policies able to follow complex trajectories involving frequent turns in both directions as well as long straight-line stretches. By repeatedly changing the heading, this method keeps the robot moving within the training platform and thus reduces human involvement and need for manual resets during the training. Real world experiments on a custom-built, low-cost quadruped demonstrate the efficacy of our method with the robot successfully navigating all validation tests. When trained with other approaches, the robot only succeeds in forward locomotion test and fails when turning is required.

arxiv情報

著者 Peter Böhm,Archie C. Chapman,Pauline Pounds
発行日 2025-03-14 03:53:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク