要約
本論文では、ある専門的な方針をソースロボットから複数の異なるロボットに転送する問題について検討する。この問題を解決するために、我々は$Meta$-$Evolve$と名付けた手法を提案する。この手法は、連続的なロボット進化を利用し、木構造の進化ロボットシーケンスの集合を通して、各ターゲットロボットに効率的にポリシーを転送する。ロボット進化木はロボット進化経路を共有することを可能にするため、我々のアプローチは素朴な一対一の政策転送を大幅に上回ることができる。我々は、最適化されたロボット進化ツリーを決定するための発見的アプローチを提示する。実験により、本方法は、複数の独立な1対1の政策転送を起動するベースラインと比較して、シミュレーションコストの観点から、操作政策の1対3の転送の効率を最大3.2$times$改善でき、機敏な運動政策の1対6の転送の効率を2.4$times$改善できることが示された。
要約(オリジナル)
We investigate the problem of transferring an expert policy from a source robot to multiple different robots. To solve this problem, we propose a method named $Meta$-$Evolve$ that uses continuous robot evolution to efficiently transfer the policy to each target robot through a set of tree-structured evolutionary robot sequences. The robot evolution tree allows the robot evolution paths to be shared, so our approach can significantly outperform naive one-to-one policy transfer. We present a heuristic approach to determine an optimized robot evolution tree. Experiments have shown that our method is able to improve the efficiency of one-to-three transfer of manipulation policy by up to 3.2$\times$ and one-to-six transfer of agile locomotion policy by 2.4$\times$ in terms of simulation cost over the baseline of launching multiple independent one-to-one policy transfers.
arxiv情報
著者 | Xingyu Liu,Deepak Pathak,Ding Zhao |
発行日 | 2024-05-06 14:52:23+00:00 |
arxivサイト | arxiv_id(pdf) |