Correspondence learning between morphologically different robots via task demonstrations

要約

私たちは多種多様なロボットをその本体、センサー、アクチュエーターの観点から観察します。
スキルセットの共通性を考慮すると、ロボット環境の多様性を考慮すると、各スキルをそれぞれの異なるロボットに個別に教えることは非効率的であり、拡張性もありません。
さまざまなロボットの感覚運動空間間の対応関係を学習できれば、1 台のロボットで学習したスキルを他のロボットにより直接的かつ容易に伝達できることが期待できます。
本稿では、形態の異なる複数のロボット間の対応関係を学習する手法を提案する。
具体的には、自由度が異なる同様の形態をもつロボットに加えて、関節制御を備えた固定ベースのマニピュレータ ロボットと差動駆動の移動ロボットも、提案されたフレームワーク内で処理できることを示します。
検討中のロボット間の対応関係を確立するには、同じ目標を達成するための最初の基本タスクをロボットにデモンストレーションします。
次に、目標を達成するための個々のロボットのポリシーとともに、共通の潜在表現が学習されます。
初期学習段階の後、1 台のロボットによる新しいタスクの実行を観察するだけで、同じタスクを達成するために他のロボットに関する潜在空間表現を生成するのに十分になります。
私たちは、ロボット間の対応関係を学習する一連の実験でシステムを検証しました (1) 同じタスクを達成するためにロボットが同じ経路をたどる必要がある場合、(2) 同じタスクを達成するためにロボットが異なる軌道をたどる必要がある場合
(3) 必要な感覚運動軌道の複雑さがロボ​​ットによって異なる場合。
また、実際のマニピュレータ ロボットと模擬移動ロボットの間の通信学習の概念実証も提供します。

要約(オリジナル)

We observe a large variety of robots in terms of their bodies, sensors, and actuators. Given the commonalities in the skill sets, teaching each skill to each different robot independently is inefficient and not scalable when the large variety in the robotic landscape is considered. If we can learn the correspondences between the sensorimotor spaces of different robots, we can expect a skill that is learned in one robot can be more directly and easily transferred to other robots. In this paper, we propose a method to learn correspondences among two or more robots that may have different morphologies. To be specific, besides robots with similar morphologies with different degrees of freedom, we show that a fixed-based manipulator robot with joint control and a differential drive mobile robot can be addressed within the proposed framework. To set up the correspondence among the robots considered, an initial base task is demonstrated to the robots to achieve the same goal. Then, a common latent representation is learned along with the individual robot policies for achieving the goal. After the initial learning stage, the observation of a new task execution by one robot becomes sufficient to generate a latent space representation pertaining to the other robots to achieve the same task. We verified our system in a set of experiments where the correspondence between robots is learned (1) when the robots need to follow the same paths to achieve the same task, (2) when the robots need to follow different trajectories to achieve the same task, and (3) when complexities of the required sensorimotor trajectories are different for the robots. We also provide a proof-of-the-concept realization of correspondence learning between a real manipulator robot and a simulated mobile robot.

arxiv情報

著者 Hakan Aktas,Yukie Nagai,Minoru Asada,Erhan Oztop,Emre Ugur
発行日 2023-11-18 17:30:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO パーマリンク