DeepTransition: Viability Leads to the Emergence of Gait Transitions in Learning Anticipatory Quadrupedal Locomotion Skills

要約

四足動物は、移動速度を変更しながら、シームレスに歩行を移行します。
歩行の遷移について最も広く受け入れられている説明はエネルギー効率ですが、決定要因や地形特性による潜在的な影響については明確なコンセンサスはありません。
この記事では、生存可能性、つまり転倒の回避が歩行移行の重要な基準であることを提案します。
私たちは、深層強化学習とロボット工学ツールを活用して、脊髄上駆動(脳)、脊髄の中枢パターン生成器、身体、外受容センシングの間の相互作用を介して歩行遷移が出現することを研究します。
四足動物のデータと一致して、平坦な地形での四足ロボットの歩行から速歩への移行により、生存率とエネルギー効率の両方が向上することが示されました。
さらに、不連続な地形(つまり、連続するギャップを横切る)が印象的な歩行遷移に及ぼす影響を調査し、生存不可能な状態を回避するための速歩の遷移の出現を発見します。
ピーク力やエネルギー効率などの他の潜在的な基準と比較すると、平らな地形と不連続なギャップ地形の両方で歩行移行後に改善された唯一の要素は生存可能性であり、生存可能性が歩行移行の主要かつ普遍的な目的である可能性がある一方、他の基準は二次的な目的である可能性があることを示唆しています
および/または生存能力の結果。
さらに、学習したコントローラーをシミュレーションとリアルのハードウェア実験に展開し、Unitree A1 四足歩行がトロットとプロンクの間で自律的に歩行を移行し、最大 30 の連続ギャップを横切るという、困難なシナリオで最先端の四足歩行の敏捷性を実証します。
1.3 m/s 以上で cm (体長の 83.3 %)。

要約(オリジナル)

Quadruped animals seamlessly transition between gaits as they change locomotion speeds. While the most widely accepted explanation for gait transitions is energy efficiency, there is no clear consensus on the determining factor, nor on the potential effects from terrain properties. In this article, we propose that viability, i.e. the avoidance of falls, represents an important criterion for gait transitions. We investigate the emergence of gait transitions through the interaction between supraspinal drive (brain), the central pattern generator in the spinal cord, the body, and exteroceptive sensing by leveraging deep reinforcement learning and robotics tools. Consistent with quadruped animal data, we show that the walk-trot gait transition for quadruped robots on flat terrain improves both viability and energy efficiency. Furthermore, we investigate the effects of discrete terrain (i.e. crossing successive gaps) on imposing gait transitions, and find the emergence of trot-pronk transitions to avoid non-viable states. Compared with other potential criteria such as peak forces and energy efficiency, viability is the only improved factor after gait transitions on both flat and discrete gap terrains, suggesting that viability could be a primary and universal objective of gait transitions, while other criteria are secondary objectives and/or a consequence of viability. Moreover, we deploy our learned controller in sim-to-real hardware experiments and demonstrate state-of-the-art quadruped agility in challenging scenarios, where the Unitree A1 quadruped autonomously transitions gaits between trot and pronk to cross consecutive gaps of up to 30 cm (83.3 % of the body-length) at over 1.3 m/s.

arxiv情報

著者 Milad Shafiee,Guillaume Bellegarda,Auke Ijspeert
発行日 2023-06-14 16:04:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO パーマリンク