On the Effectiveness of Retrieval, Alignment, and Replay in Manipulation

要約

視覚観察による模倣学習は、エンドツーエンドの行動クローニング手法で対処すると非効率であることで知られています。
この論文では、推論を 3 つのフェーズに分解する代替パラダイムを検討します。
まず、検索フェーズで、オブジェクトに対して何ができるかをロボットに知らせます。
2 番目は、オブジェクトと対話する場所をロボットに通知する位置合わせフェーズです。
そして 3 番目は、オブジェクトと対話する方法をロボットに通知するリプレイ フェーズです。
物体をつかむ、注ぐ、挿入するなどの日常的な作業に関する一連の実世界の実験を通じて、この分解が前例のない学習効率と、クラス内およびクラス内での効果的な一般化をもたらすことを示しました。
ビデオは https://www.robot-learning.uk/retrieval-alignment-replay でご覧いただけます。

要約(オリジナル)

Imitation learning with visual observations is notoriously inefficient when addressed with end-to-end behavioural cloning methods. In this paper, we explore an alternative paradigm which decomposes reasoning into three phases. First, a retrieval phase, which informs the robot what it can do with an object. Second, an alignment phase, which informs the robot where to interact with the object. And third, a replay phase, which informs the robot how to interact with the object. Through a series of real-world experiments on everyday tasks, such as grasping, pouring, and inserting objects, we show that this decomposition brings unprecedented learning efficiency, and effective inter- and intra-class generalisation. Videos are available at https://www.robot-learning.uk/retrieval-alignment-replay.

arxiv情報

著者 Norman Di Palo,Edward Johns
発行日 2023-12-19 17:17:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO パーマリンク