How Can Everyday Users Efficiently Teach Robots by Demonstrations?

要約

Learning from Demonstration (LfD) は、一般ユーザーでも簡単にロボットをプログラミングできるフレームワークです。
ただし、ロボットの学習効率とタスクのバリエーションに一般化するロボットの能力は、提供されるデモンストレーションの質と量に依存します。
私たちの目的は、人間の教師がより効果的なデモンストレーションを行えるようにガイドし、効率的なロボット学習を促進することです。
これを達成するために、教師の指導スキルを向上させるために有益なデモンストレーション例を人間の教師に提案するための基準として、不確実性の尺度、つまりタスク関連情報エントロピーを使用することを提案します。
実施された実験 (N=24) では、拡張現実 (AR) ベースのガイダンス システムを使用して、初心者ユーザーがワークスペース内で最もエントロピーが高い領域から追加のデモンストレーションを作成できるように訓練しました。
これらの初心者ユーザーは、限られた数のデモンストレーションを使用してロボットに一般化可能なタスクを教えるために、数回のトライアルのトレーニングを受けました。
その後、トレーニング後のユーザーのパフォーマンスが、最初に同じタスク (定着) で評価され、次にガイダンスなしで新しいタスク (移行) で評価されました。
その結果、教師のデモンストレーションからロボットの学習効率が大幅に向上し、新しいタスクでは最大 198% の向上が観察されました。
さらに、提案されたアプローチは最先端のヒューリスティック ルールと比較され、ヒューリスティック ルールと比較してロボットの学習効率が 210% 向上することがわかりました。

要約(オリジナル)

Learning from Demonstration (LfD) is a framework that allows lay users to easily program robots. However, the efficiency of robot learning and the robot’s ability to generalize to task variations hinges upon the quality and quantity of the provided demonstrations. Our objective is to guide human teachers to furnish more effective demonstrations, thus facilitating efficient robot learning. To achieve this, we propose to use a measure of uncertainty, namely task-related information entropy, as a criterion for suggesting informative demonstration examples to human teachers to improve their teaching skills. In a conducted experiment (N=24), an augmented reality (AR)-based guidance system was employed to train novice users to produce additional demonstrations from areas with the highest entropy within the workspace. These novice users were trained for a few trials to teach the robot a generalizable task using a limited number of demonstrations. Subsequently, the users’ performance after training was assessed first on the same task (retention) and then on a novel task (transfer) without guidance. The results indicated a substantial improvement in robot learning efficiency from the teacher’s demonstrations, with an improvement of up to 198% observed on the novel task. Furthermore, the proposed approach was compared to a state-of-the-art heuristic rule and found to improve robot learning efficiency by 210% compared to the heuristic rule.

arxiv情報

著者 Maram Sakr,Zhikai Zhang,Benjamin Li,Haomiao Zhang,H. F. Machiel Van der Loos,Dana Kulic,Elizabeth Croft
発行日 2023-10-19 18:21:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO パーマリンク