要約
知能ロボット工学の基本的な目的は、生涯学習ロボットに移行することである。しかし、新しいタスクを継続的に学習することは、データ分布のシフトによる壊滅的な忘却問題を引き起こす。この問題を軽減するために、我々は、過去のタスクのデータのサブセットを保存し、それを2つの方法で利用する:学習したスキルを保持するために経験再生を活用し、関連する知識を復元するために新しい検索ベースの局所適応技術を適用する。生涯学習ロボットは、タスクIDや境界さえも利用できないタスクのないシナリオで動作する必要があるため、本手法はそのような情報に依存することなく効果的に動作する。また、最も「忘れ去られた」スキルセグメントに焦点を当てるために、選択的な重み付けメカニズムを組み込み、効果的な知識の復元を保証する。多様な操作タスクにおける実験結果は、我々のフレームワークが生涯学習のためのスケーラブルなパラダイムを提供し、オープンエンドでタスクのないシナリオにおけるロボットのパフォーマンスを向上させることを示している。
要約(オリジナル)
A fundamental objective in intelligent robotics is to move towards lifelong learning robot that can learn and adapt to unseen scenarios over time. However, continually learning new tasks would introduce catastrophic forgetting problems due to data distribution shifts. To mitigate this, we store a subset of data from previous tasks and utilize it in two manners: leveraging experience replay to retain learned skills and applying a novel Retrieval-based Local Adaptation technique to restore relevant knowledge. Since a lifelong learning robot must operate in task-free scenarios, where task IDs and even boundaries are not available, our method performs effectively without relying on such information. We also incorporate a selective weighting mechanism to focus on the most ‘forgotten’ skill segment, ensuring effective knowledge restoration. Experimental results across diverse manipulation tasks demonstrate that our framework provides a scalable paradigm for lifelong learning, enhancing robot performance in open-ended, task-free scenarios.
arxiv情報
著者 | Pengzhi Yang,Xinyu Wang,Ruipeng Zhang,Cong Wang,Frans A. Oliehoek,Jens Kober |
発行日 | 2025-02-03 12:08:50+00:00 |
arxivサイト | arxiv_id(pdf) |