Evaluating Continual Learning on a Home Robot

要約

家庭環境のロボットは、データが利用可能になるにつれて新しいスキルを継続的に学習し、現実世界のデータをできるだけ少なくしながら、時間の経過とともにさらに能力が向上する必要があります。
ただし、従来のロボット学習アプローチは通常、大量の iid データを前提としており、これはこの目標と矛盾します。
対照的に、CLEAR や SANE のような継続的な学習方法を使用すると、自律エージェントは非 IID サンプルのストリームから学習できます。
ただし、実際のロボットプラットフォームではこれまで実証されていませんでした。
この研究では、継続学習手法を実際の低コストの家庭用ロボットでの使用にどのように適用できるかを示し、特に、タスク ID のない設定で、例の数が非常に少ない場合に注目します。
具体的には、スキルのライブラリを継続的に学習する手法であるSANERと、それを支えるバックボーンとなるABIP(Attendee-Based Interaction Policies)を提案します。
低コストの家庭用ロボットを使用して、タスクごとに数回のデモン​​ストレーションのみを使用して、4 つの連続したキッチン タスクを学習します。

要約(オリジナル)

Robots in home environments need to be able to learn new skills continuously as data becomes available, becoming ever more capable over time while using as little real-world data as possible. However, traditional robot learning approaches typically assume large amounts of iid data, which is inconsistent with this goal. In contrast, continual learning methods like CLEAR and SANE allow autonomous agents to learn off of a stream of non-iid samples; they, however, have not previously been demonstrated on real robotics platforms. In this work, we show how continual learning methods can be adapted for use on a real, low-cost home robot, and in particular look at the case where we have extremely small numbers of examples, in a task-id-free setting. Specifically, we propose SANER, a method for continuously learning a library of skills, and ABIP (Attention-Based Interaction Policies) as the backbone to support it. We learn four sequential kitchen tasks on a low-cost home robot, using only a handful of demonstrations per task.

arxiv情報

著者 Sam Powers,Abhinav Gupta,Chris Paxton
発行日 2023-06-04 17:14:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク