SARI: Shared Autonomy across Repeated Interaction

要約

支援ロボット アームは、ユーザーが日常のタスクを実行するのを支援しようとします。
ロボットがこの支援を提供できる 1 つの方法は、自律性の共有です。
共有された自律性の中で、人間とロボットの両方がロボットの動きを制御し続けます。ロボットは、人間が何を望んでいるかを理解していると確信できるようになると、タスクを自動化するために介入します。
しかし、そもそもロボットはどのようにしてこれらのタスクを認識しているのでしょうか?
自律性を共有するための最先端のアプローチは、多くの場合、事前の知識に依存しています。
たとえば、ロボットは人間の潜在的な目標を事前に知る必要がある場合があります。
長期的な相互作用の間、これらの方法は必然的に崩壊します。遅かれ早かれ、人間はロボットが予期しないタスクを実行しようとします。
したがって、この論文では、支援をゼロから学習する共有自律性への代替アプローチを定式化します。
私たちの洞察では、オペレータは毎日重要な作業を繰り返しています (冷蔵庫を開ける、コーヒーを淹れるなど)。
したがって、事前の知識に頼る代わりに、これらの繰り返される相互作用を利用して支援ポリシーを学習します。
人間のタスクを認識し、同様のデモンストレーションを複製し、不明な場合に制御を返すアルゴリズムである SARI を紹介します。
次に、学習と制御を組み合わせて、アプローチのエラーが均一に最終的に制限されることを示します。
このエラー バウンドをサポートするためにシミュレーションを実行し、模倣学習ベースラインに対するアプローチを比較し、増加するタスク数を支援する能力を調査します。
最後に、障害のあるユーザーを対象としたパイロット テストを含む、業界標準の方法と共有された自律性ベースラインを使用して 3 つのユーザー調査を実施します。
私たちの結果は、繰り返される相互作用を通じて共有された自律性を学習することは、既知のタスクに対する既存のアプローチと一致し、新しいタスクのベースラインよりも優れていることを示しています。
こちらのユーザー調査のビデオをご覧ください: https://youtu.be/3vE4omSvLvc

要約(オリジナル)

Assistive robot arms try to help their users perform everyday tasks. One way robots can provide this assistance is shared autonomy. Within shared autonomy, both the human and robot maintain control over the robot’s motion: as the robot becomes confident it understands what the human wants, it intervenes to automate the task. But how does the robot know these tasks in the first place? State-of-the-art approaches to shared autonomy often rely on prior knowledge. For instance, the robot may need to know the human’s potential goals beforehand. During long-term interaction these methods will inevitable break down — sooner or later the human will attempt to perform a task that the robot does not expect. Accordingly, in this paper we formulate an alternate approach to shared autonomy that learns assistance from scratch. Our insight is that operators repeat important tasks on a daily basis (e.g., opening the fridge, making coffee). Instead of relying on prior knowledge, we therefore take advantage of these repeated interactions to learn assistive policies. We introduce SARI, an algorithm that recognizes the human’s task, replicates similar demonstrations, and returns control when unsure. We then combine learning with control to demonstrate that the error of our approach is uniformly ultimately bounded. We perform simulations to support this error bound, compare our approach to imitation learning baselines, and explore its capacity to assist for an increasing number of tasks. Finally, we conduct three user studies with industry-standard methods and shared autonomy baselines, including a pilot test with a disabled user. Our results indicate that learning shared autonomy across repeated interactions matches existing approaches for known tasks and outperforms baselines on new tasks. See videos of our user studies here: https://youtu.be/3vE4omSvLvc

arxiv情報

著者 Ananth Jonnavittula,Shaunak A. Mehta,Dylan P. Losey
発行日 2023-02-17 05:42:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク