Multi-Stage Cable Routing through Hierarchical Imitation Learning

要約

私たちは、ロボットが一連のクリップを通してケーブルを配線する必要があるケーブル配線への応用を用いて、多段階のロボット操作タスクの実行方法を学習する問題を研究します。
この設定では、複雑な多段階のロボット操作シナリオを代表する課題が提示されます。つまり、変形可能なオブジェクトの処理、視覚認識のループの終了、タスク全体を完了するために正常に実行する必要がある複数のステップで構成される拡張動作の処理などです。
このような設定では、時間的に拡張された完全なタスクを実行するのに十分な高い率で成功する各ステージの個別のプリミティブを学習することは非現実的です。各ステージが正常に完了する必要があり、失敗の確率が無視できない場合、正常に完了する可能性は高くなります。
タスク全体が無視できるようになります。
したがって、このような多段階タスクを成功させるコントローラーは、いつでもトリガーするコントローラーを賢く選択し、再試行したり、必要に応じて修正措置を講じたりすることで、障害から回復し、低レベルのコントローラーの不完全性を補うことができる必要があります。
この目的を達成するために、下位 (モーター制御) レベルと上位 (シーケンス) レベルの両方でのデモンストレーションから訓練されたビジョンベースのポリシーを使用する模倣学習システムについて説明し、この方法をインスタンス化してケーブル配線タスクを学習するためのシステムを提示します。
非常に困難なクリップ配置のバリエーションを一般化する際に優れたパフォーマンスを示す評価を実行します。
補足のビデオ、データセット、コードは、https://sites.google.com/view/cablerouting でご覧いただけます。

要約(オリジナル)

We study the problem of learning to perform multi-stage robotic manipulation tasks, with applications to cable routing, where the robot must route a cable through a series of clips. This setting presents challenges representative of complex multi-stage robotic manipulation scenarios: handling deformable objects, closing the loop on visual perception, and handling extended behaviors consisting of multiple steps that must be executed successfully to complete the entire task. In such settings, learning individual primitives for each stage that succeed with a high enough rate to perform a complete temporally extended task is impractical: if each stage must be completed successfully and has a non-negligible probability of failure, the likelihood of successful completion of the entire task becomes negligible. Therefore, successful controllers for such multi-stage tasks must be able to recover from failure and compensate for imperfections in low-level controllers by smartly choosing which controllers to trigger at any given time, retrying, or taking corrective action as needed. To this end, we describe an imitation learning system that uses vision-based policies trained from demonstrations at both the lower (motor control) and the upper (sequencing) level, present a system for instantiating this method to learn the cable routing task, and perform evaluations showing great performance in generalizing to very challenging clip placement variations. Supplementary videos, datasets, and code can be found at https://sites.google.com/view/cablerouting.

arxiv情報

著者 Jianlan Luo,Charles Xu,Xinyang Geng,Gilbert Feng,Kuan Fang,Liam Tan,Stefan Schaal,Sergey Levine
発行日 2023-07-18 02:14:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク