要約
筋骨格系の運動コントローラーを学習することは、過剰作動と高次元の動作空間のため困難です。
多くの強化学習手法はこの問題に対処しようとしていますが、効果的な報酬関数のエンジニアリングに伴う複雑さのため、人間のような歩き方を学習するのに苦労することがよくあります。
この論文では、主要な問題を分析し、現在の文献と新しい技術の両方を使用して解決策を提供することで、敵対的模倣学習がこの問題に対処できることを実証します。
16 の自由度と 92 個の筋腱ユニットを備えたシミュレートされたヒューマノイド モデルで歩行と走行の歩行を学習することで方法論を検証し、わずか数回のデモンストレーションで自然に見える歩行を実現します。
要約(オリジナル)
Learning a locomotion controller for a musculoskeletal system is challenging due to over-actuation and high-dimensional action space. While many reinforcement learning methods attempt to address this issue, they often struggle to learn human-like gaits because of the complexity involved in engineering an effective reward function. In this paper, we demonstrate that adversarial imitation learning can address this issue by analyzing key problems and providing solutions using both current literature and novel techniques. We validate our methodology by learning walking and running gaits on a simulated humanoid model with 16 degrees of freedom and 92 Muscle-Tendon Units, achieving natural-looking gaits with only a few demonstrations.
arxiv情報
著者 | Henri-Jacques Geiß,Firas Al-Hafez,Andre Seyfarth,Jan Peters,Davide Tateo |
発行日 | 2024-07-16 12:27:55+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google