Brain-Body-Task Co-Adaptation can Improve Autonomous Learning and Speed of Bipedal Walking

要約

このロボットは、(i)バックドライブ可能な機械的特性を利用して、明示的な制御なしに身体と環境の相互作用を管理し、(ii)単純な3層ニューラルネットワークを使用して、わずか2分間の「自然な」運動喃語(すなわち、脚とタスクのダイナミクスに適合した探索戦略;子供の遊びのようなもの)の後に歩行を学習する。この脳と身体の協働は、まず「空中で」周期的な足の動きを生み出すことを学習し、さらにチューニングを行わなくても、二足歩行が地面にわずかに接するように下降したときにロコモーションを生み出すことができる。対照的に、2分間の「素朴な」モーターバブリング(すなわち、脚のタスクダイナミクスを無視した探索戦略)を用いたトレーニングでは、「空中で」一貫した周期的な運動が得られず、不規則な運動が生じ、地面とわずかに接触しているときには運動が生じない。さらに二足歩行を下降させ、希望する脚の軌道を地面から1cm下に到達させると(希望する軌道と到達した軌道の誤差が避けられなくなる)、自然な喃語と素朴な喃語のいずれに基づく周期運動もほぼ同じように持続的な傾向を示し、素朴な喃語では運動が出現した。したがって、不測の事態における歩行の継続的な学習が、植物のバックドライブ可能な特性に根ざした継続的な身体適応によって推進され、植物のダイナミクスを利用した探索戦略によって強化されることを示す。また、手足と制御戦略のバイオインスパイアされた協調設計と共適応により、軌道誤差を明示的に制御することなくロコモーションを生み出すことができることも示している。

要約(オリジナル)

Inspired by animals that co-adapt their brain and body to interact with the environment, we present a tendon-driven and over-actuated (i.e., n joint, n+1 actuators) bipedal robot that (i) exploits its backdrivable mechanical properties to manage body-environment interactions without explicit control, and (ii) uses a simple 3-layer neural network to learn to walk after only 2 minutes of ‘natural’ motor babbling (i.e., an exploration strategy that is compatible with leg and task dynamics; akin to childsplay). This brain-body collaboration first learns to produce feet cyclical movements ‘in air’ and, without further tuning, can produce locomotion when the biped is lowered to be in slight contact with the ground. In contrast, training with 2 minutes of ‘naive’ motor babbling (i.e., an exploration strategy that ignores leg task dynamics), does not produce consistent cyclical movements ‘in air’, and produces erratic movements and no locomotion when in slight contact with the ground. When further lowering the biped and making the desired leg trajectories reach 1cm below ground (causing the desired-vs-obtained trajectories error to be unavoidable), cyclical movements based on either natural or naive babbling presented almost equally persistent trends, and locomotion emerged with naive babbling. Therefore, we show how continual learning of walking in unforeseen circumstances can be driven by continual physical adaptation rooted in the backdrivable properties of the plant and enhanced by exploration strategies that exploit plant dynamics. Our studies also demonstrate that the bio-inspired codesign and co-adaptations of limbs and control strategies can produce locomotion without explicit control of trajectory errors.

arxiv情報

著者 Darío Urbina-Meléndez,Hesam Azadjou,Francisco J. Valero-Cuevas
発行日 2024-02-04 07:57:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.RO パーマリンク