AllGaits: Learning All Quadruped Gaits and Transitions

要約

すべての四足歩行とトランジションを生成できる単一のポリシーを学習するためのフレームワークを紹介します。
このフレームワークは、深層強化学習 (DRL) でトレーニングされたポリシーで構成され、抽象発振器システム (つまり、中央パターン ジェネレーター) のパラメーターを調整します。その出力は、歩行スタイルを設定するパターン形成層を介して関節コマンドにマッピングされます。
車体の高さ、スイングフットの地上高の高さ、およびフットのオフセット。
異なる振動子間の結合を変更することで異なる歩行が形成され、ユーザーは任意の速度で瞬時に選択できます。
このフレームワークを使用して、輸送コスト(COT)、つまりエネルギー効率の観点から、どの速度でどの歩行を使用する必要があるか、また歩行の移行をいつ行う必要があるかを体系的に調査します。
さらに、最もエネルギー効率の高い移動を維持するために、各歩行の移動速度の関数として歩行スタイルがどのように変化するかに注目します。
現在最も一般的な歩行 (速歩) は最低 COT にはなりませんが、平均基礎速度や関節加速度などのさまざまな共依存指標を考慮すると、COT を最小化する歩行とは異なる「最適な」歩行が得られることがわかりました。
私たちはコントローラーをさまざまなハードウェア実験に展開し、9 つの典型的な四足動物の歩行をすべて示し、トレーニング中に目に見えない歩行に対する一般化可能性と脚の故障に対する堅牢性を実証しました。
ビデオ結果は https://youtu.be/OLoWSX_R868 でご覧いただけます。

要約(オリジナル)

We present a framework for learning a single policy capable of producing all quadruped gaits and transitions. The framework consists of a policy trained with deep reinforcement learning (DRL) to modulate the parameters of a system of abstract oscillators (i.e. Central Pattern Generator), whose output is mapped to joint commands through a pattern formation layer that sets the gait style, i.e. body height, swing foot ground clearance height, and foot offset. Different gaits are formed by changing the coupling between different oscillators, which can be instantaneously selected at any velocity by a user. With this framework, we systematically investigate which gait should be used at which velocity, and when gait transitions should occur from a Cost of Transport (COT), i.e. energy-efficiency, point of view. Additionally, we note how gait style changes as a function of locomotion speed for each gait to keep the most energy-efficient locomotion. While the currently most popular gait (trot) does not result in the lowest COT, we find that considering different co-dependent metrics such as mean base velocity and joint acceleration result in different `optimal’ gaits than those that minimize COT. We deploy our controller in various hardware experiments, showing all 9 typical quadruped animal gaits, and demonstrate generalizability to unseen gaits during training, and robustness to leg failures. Video results can be found at https://youtu.be/OLoWSX_R868.

arxiv情報

著者 Guillaume Bellegarda,Milad Shafiee,Auke Ijspeert
発行日 2024-11-07 15:28:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク