iManip: Skill-Incremental Learning for Robotic Manipulation

要約

適応的な複数の操作スキルを備えたジェネラリストのエージェントの開発は、ロボットコミュニティで長年の目標となっています。
この論文では、ロボット操作において、重要なタスクであるスキル – 能力学習を調査します。これは、再訓練なしで以前の学習知識に基づいて新しい操作スキルを学習する能力をロボットに与えることです。
まず、RLBenchベンチマークに基づいてスキルインクリメンタル環境を構築し、この設定で従来のインクリメンタルメソッドがどのように機能するかを調査します。
ロボット操作タスクの時間性と作用の複雑さの特性を見落とす分類に関する以前の方法により、彼らは重度の壊滅的な忘却に苦しんでいることがわかります。
この目的に向けて、上記の問題を軽減するために、Imanipと呼ばれる増分マニップ} ulationフレームワークを提案します。
まず、新しいスキルを学ぶときに古いスキルの完全性を維持するための一時的なリプレイ戦略を設計します。
さらに、新しいスキルの新しいアクションプリミティブに適応するために、拡張可能な重量を持つアクションプロンプトで構成される拡張可能な知覚型を提案します。
広範な実験では、私たちのフレームワークがスキルの学習でうまく機能することが示されています。
私たちのフレームワークを備えたスキル関節環境のコードは、オープンソースになります。

要約(オリジナル)

The development of a generalist agent with adaptive multiple manipulation skills has been a long-standing goal in the robotics community. In this paper, we explore a crucial task, skill-incremental learning, in robotic manipulation, which is to endow the robots with the ability to learn new manipulation skills based on the previous learned knowledge without re-training. First, we build a skill-incremental environment based on the RLBench benchmark, and explore how traditional incremental methods perform in this setting. We find that they suffer from severe catastrophic forgetting due to the previous methods on classification overlooking the characteristics of temporality and action complexity in robotic manipulation tasks. Towards this end, we propose an incremental Manip}ulation framework, termed iManip, to mitigate the above issues. We firstly design a temporal replay strategy to maintain the integrity of old skills when learning new skill. Moreover, we propose the extendable PerceiverIO, consisting of an action prompt with extendable weight to adapt to new action primitives in new skill. Extensive experiments show that our framework performs well in Skill-Incremental Learning. Codes of the skill-incremental environment with our framework will be open-source.

arxiv情報

著者 Zexin Zheng,Jia-Feng Cai,Xiao-Ming Wu,Yi-Lin Wei,Yu-Ming Tang,Wei-Shi Zheng
発行日 2025-03-10 09:10:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク