要約
動的な非構造化環境での実際のロボット操作には、進化するオブジェクト、シーン、タスクに生涯にわたる適応性が必要です。
従来の模倣学習は、生涯にわたる適応に適していない静的トレーニングパラダイムに依存しています。
継続的な模倣Learnin(CIL)は、学習知識を保存しながら漸進的なタスク適応を可能にしますが、現在のCILメソッドは主にロボット操作の本質的なスキル特性を見落としているか、手動で定義された剛性スキルに依存し、最適ではないクロスタスク知識移転につながります。
これらの問題に対処するために、ロボット操作のための新しいエンドツーエンドの階層CILポリシーアーキテクチャであるスキルプロンプトベースの階層模倣学習(SPECI)を提案します。
Speciフレームワークは、異種の感覚情報エンコーディングのマルチモーダル知覚と融合モジュール、動的なスキル抽出と選択のための高レベルのスキル推論モジュール、および正確なアクション生成のための低レベルのアクション実行モジュールで構成されています。
スキルレベルとタスクレベルの両方で効率的な知識転送を可能にするために、Speciは拡張可能なスキルコードブックと注意駆動型スキル選択メカニズムを介して継続的な暗黙的なスキル獲得と再利用を実行します。
さらに、タスク固有およびタスク共有パラメーターを備えた最後の2つのモジュールを増強するモード近似を導入し、それによりタスクレベルの知識転送を強化します。
多様な操作タスクスイートに関する広範な実験は、Speciがすべての評価されたメトリックで一貫して最先端のCILメソッドを上回り、例外的な双方向の知識移転と優れた全体的なパフォーマンスを明らかにすることを示しています。
要約(オリジナル)
Real-world robot manipulation in dynamic unstructured environments requires lifelong adaptability to evolving objects, scenes and tasks. Traditional imitation learning relies on static training paradigms, which are ill-suited for lifelong adaptation. Although Continual Imitation Learnin (CIL) enables incremental task adaptation while preserving learned knowledge, current CIL methods primarily overlook the intrinsic skill characteristics of robot manipulation or depend on manually defined and rigid skills, leading to suboptimal cross-task knowledge transfer. To address these issues, we propose Skill Prompts-based HiErarchical Continual Imitation Learning (SPECI), a novel end-to-end hierarchical CIL policy architecture for robot manipulation. The SPECI framework consists of a multimodal perception and fusion module for heterogeneous sensory information encoding, a high-level skill inference module for dynamic skill extraction and selection, and a low-level action execution module for precise action generation. To enable efficient knowledge transfer on both skill and task levels, SPECI performs continual implicit skill acquisition and reuse via an expandable skill codebook and an attention-driven skill selection mechanism. Furthermore, we introduce mode approximation to augment the last two modules with task-specific and task-sharing parameters, thereby enhancing task-level knowledge transfer. Extensive experiments on diverse manipulation task suites demonstrate that SPECI consistently outperforms state-of-the-art CIL methods across all evaluated metrics, revealing exceptional bidirectional knowledge transfer and superior overall performance.
arxiv情報
著者 | Jingkai Xu,Xiangli Nie |
発行日 | 2025-04-22 03:30:38+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google