Correspondence learning between morphologically different robots through task demonstrations

要約

私たちは多種多様なロボットをその本体、センサー、アクチュエーターの観点から観察します。
スキルセットの共通性を考慮すると、ロボット環境の多様性を考慮すると、各スキルをそれぞれの異なるロボットに個別に教えることは非効率的であり、拡張性もありません。
異なるロボットの感覚運動空間間の対応関係を学習できれば、1 台のロボットで学習したスキルを他のロボットにより直接的かつ容易に伝達できることが期待できます。
本稿では、関節制御を備えた固定ベースのマニピュレータロボットと差動駆動の移動ロボットという、形態に大きな違いがあるロボット間の対応関係を学習する手法を提案する。
このため、最初に両方のロボットに同じタスクを実行するデモンストレーションが行われます。
対応するポリシーを学習する際に、共通の潜在表現が形成されます。
この初期学習段階の後、1 台のロボットによる新しいタスクの実行を観察するだけで、同じタスクを達成するための他のロボットに関する潜在空間表現を生成するのに十分になります。
私たちは、2 つのシミュレートされたロボット間の対応関係を学習する一連の実験でシステムを検証しました (1) 同じタスクを達成するためにロボットが同じ経路をたどる必要がある場合、(2) 目的を達成するためにロボットが異なる軌道をたどる必要がある場合
同じタスク、および (3) 必要な感覚運動軌道の複雑さが、対象となるロボットごとに異なる場合。
また、実際のマニピュレータ ロボットと模擬移動ロボットの間の通信学習の概念実証も提供します。

要約(オリジナル)

We observe a large variety of robots in terms of their bodies, sensors, and actuators. Given the commonalities in the skill sets, teaching each skill to each different robot independently is inefficient and not scalable when the large variety in the robotic landscape is considered. If we can learn the correspondences between the sensorimotor spaces of different robots, we can expect a skill that is learned in one robot can be more directly and easily transferred to the other robots. In this paper, we propose a method to learn correspondences between robots that have significant differences in their morphologies: a fixed-based manipulator robot with joint control and a differential drive mobile robot. For this, both robots are first given demonstrations that achieve the same tasks. A common latent representation is formed while learning the corresponding policies. After this initial learning stage, the observation of a new task execution by one robot becomes sufficient to generate a latent space representation pertaining to the other robot to achieve the same task. We verified our system in a set of experiments where the correspondence between two simulated robots is learned (1) when the robots need to follow the same paths to achieve the same task, (2) when the robots need to follow different trajectories to achieve the same task, and (3) when complexities of the required sensorimotor trajectories are different for the robots considered. We also provide a proof-of-the-concept realization of correspondence learning between a real manipulator robot and a simulated mobile robot.

arxiv情報

著者 Hakan Aktas,Yukie Nagai,Minoru Asada,Erhan Oztop,Emre Ugur
発行日 2023-10-20 12:42:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO パーマリンク