PECAN: Personalizing Robot Behaviors through a Learned Canonical Space

要約

ロボットは、人間の個々のユーザーのニーズに合わせてタスクの実行方法をパーソナライズする必要があります。
今日のロボットは、タスク空間で人間のフィードバックを求めることで、このパーソナライゼーションを実現します。
たとえば、自動運転車は、信号で減速する 2 つの異なる方法を人間に示し、どちらの動作が好みかを人間に尋ねる可能性があります。
このパーソナライゼーションへの現在のアプローチは間接的です。人間が選択した行動 (例: ゆっくりと減速する) に基づいて、ロボットは人間の根本的な好み (例: 防御運転) を推測しようとします。
対照的に、私たちの論文は、人間が希望のスタイルを直接指定できるようにする、学習およびインターフェイスベースのアプローチを開発します。
これは、人間のデモンストレーション データから抽象的、低次元、連続的な標準空間を学習することによって行われます。
標準空間内の各ポイントは異なるスタイル (防御的または攻撃的な運転など) に対応しており、ユーザーはポイントをクリックするだけでロボットの動作を直接カスタマイズできます。
人間の選択を考慮すると、ロボットはデータセット内の各タスクにわたってこの標準的なスタイルを解読します。たとえば、人間が防御スタイルを選択した場合、自動運転車は、減速したり、他の車を追い越したり、高速道路に合流したりするときに防御的に運転するようにその動作をカスタマイズします。

私たちは、その結果として得られたアプローチを「PECAN: 学習された正規空間を介したロボットの動作のパーソナライズ」と呼びます。
私たちのシミュレーションとユーザー調査から、人間はロボットの動作を直接パーソナライズするために PECAN を使用することを好み(特にユーザーが PECAN に慣れてきた場合)、ユーザーは学習された正規空間が直感的で一貫していると感じていることが示唆されています。
ここでビデオをご覧ください: https://youtu.be/wRJpyr23PKI

要約(オリジナル)

Robots should personalize how they perform tasks to match the needs of individual human users. Today’s robot achieve this personalization by asking for the human’s feedback in the task space. For example, an autonomous car might show the human two different ways to decelerate at stoplights, and ask the human which of these motions they prefer. This current approach to personalization is indirect: based on the behaviors the human selects (e.g., decelerating slowly), the robot tries to infer their underlying preference (e.g., defensive driving). By contrast, our paper develops a learning and interface-based approach that enables humans to directly indicate their desired style. We do this by learning an abstract, low-dimensional, and continuous canonical space from human demonstration data. Each point in the canonical space corresponds to a different style (e.g., defensive or aggressive driving), and users can directly personalize the robot’s behavior by simply clicking on a point. Given the human’s selection, the robot then decodes this canonical style across each task in the dataset — e.g., if the human selects a defensive style, the autonomous car personalizes its behavior to drive defensively when decelerating, passing other cars, or merging onto highways. We refer to our resulting approach as PECAN: Personalizing Robot Behaviors through a Learned Canonical Space. Our simulations and user studies suggest that humans prefer using PECAN to directly personalize robot behavior (particularly when those users become familiar with PECAN), and that users find the learned canonical space to be intuitive and consistent. See videos here: https://youtu.be/wRJpyr23PKI

arxiv情報

著者 Heramb Nemlekar,Robert Ramirez Sanchez,Dylan P. Losey
発行日 2024-07-22 22:59:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク