How Much Progress Did I Make? An Unexplored Human Feedback Signal for Teaching Robots

要約

人間による教育の表現力を高めることは、ロボットによる人間からの学習と、人間とロボットの教育体験の両方を向上させるために不可欠です。
この研究では、タスクの完了率を表すように設計された、あまり使用されていない教育信号 \textit{progress} を特徴付け、テストします。
この進歩シグナルの能力を検証するために、76 人のクラウドソーシング参加者を対象とした 2 つのオンライン調査と、40 人の非専門参加者を対象とした 1 つの公共空間調査を実施しました。
進捗状況は、タスクが正常に実行されたかどうかを示し、タスクの完了度を反映し、非生産的だが無害な行動を識別し、参加者間でより一貫性がある可能性が高いことがわかりました。
さらに、私たちの結果は、進歩をもたらすために余分な作業負荷や時間を必要としないことを示しています。
私たちの研究の追加の貢献は、アイスクリームのトッピング追加タスクを通じた公共空間の研究からの 40 件の非専門家デモンストレーションのデータセットです。これは、遠隔操作だけでなく、複数のポリシーがあり次善であることが観察されています。
エラーだけでなく、探索的なアクションや試行によるものも含まれます。
データセットは \url{https://github.com/TeachingwithProgress/Non-Expert\_Demonstration} で入手できます。

要約(オリジナル)

Enhancing the expressiveness of human teaching is vital for both improving robots’ learning from humans and the human-teaching-robot experience. In this work, we characterize and test a little-used teaching signal: \textit{progress}, designed to represent the completion percentage of a task. We conducted two online studies with 76 crowd-sourced participants and one public space study with 40 non-expert participants to validate the capability of this progress signal. We find that progress indicates whether the task is successfully performed, reflects the degree of task completion, identifies unproductive but harmless behaviors, and is likely to be more consistent across participants. Furthermore, our results show that giving progress does not require extra workload and time. An additional contribution of our work is a dataset of 40 non-expert demonstrations from the public space study through an ice cream topping-adding task, which we observe to be multi-policy and sub-optimal, with sub-optimality not only from teleoperation errors but also from exploratory actions and attempts. The dataset is available at \url{https://github.com/TeachingwithProgress/Non-Expert\_Demonstrations}.

arxiv情報

著者 Hang Yu,Qidi Fang,Shijie Fang,Reuben M. Aronson,Elaine Schaertl Short
発行日 2024-07-08 23:47:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO パーマリンク