要約
効果的な調整は、特にエージェントとそのモーションの複雑さが増すにつれて、強化学習によるモーション制御にとって非常に重要です。
しかし、既存の手法の多くは、ジョイント間の複雑な依存関係を説明するのに苦労しています。
CoordiGraph は、物理学の準等変原理を活用して強化学習によるモーション制御の調整を強化する新しいアーキテクチャです。
この方法は、重力の影響下での学習プロセスに固有のパターンとして等変性の原則を埋め込み、モーション制御に不可欠な関節間の微妙な関係をモデル化するのに役立ちます。
さまざまな環境で高度なエージェントを使用した広範な実験を通じて、私たちはアプローチのメリットを強調します。
現在の主要な手法と比較して、CoordiGraph は一般化とサンプル効率を著しく向上させます。
要約(オリジナル)
Effective coordination is crucial for motion control with reinforcement learning, especially as the complexity of agents and their motions increases. However, many existing methods struggle to account for the intricate dependencies between joints. We introduce CoordiGraph, a novel architecture that leverages subequivariant principles from physics to enhance coordination of motion control with reinforcement learning. This method embeds the principles of equivariance as inherent patterns in the learning process under gravity influence, which aids in modeling the nuanced relationships between joints vital for motion control. Through extensive experimentation with sophisticated agents in diverse environments, we highlight the merits of our approach. Compared to current leading methods, CoordiGraph notably enhances generalization and sample efficiency.
arxiv情報
著者 | Haoyu Wang,Xiaoyu Tan,Xihe Qiu,Chao Qu |
発行日 | 2024-03-22 10:39:22+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google