Should Collaborative Robots be Transparent?

要約

私たちはしばしば、人間と協働するロボットは透明な方法(例えば、読みやすい、説明可能な方法)で動作するべきだと仮定します。
これらの透明なロボットは、内部の状態を近くの人間に伝える動作を意図的に選択します。たとえば、透明なロボットは、その目標を示すためにその軌跡を誇張する場合があります。
しかし、透明な動作は人間とロボットのインタラクションにとって有益であるように見えますが、実際には最適なのでしょうか?
この論文では、人間とロボットが同じ目的を持っていて、人間がロボットのタイプ (つまり、ロボットの内部状態) について不確実である場合の協調環境を検討します。
ベイジアン ナッシュ均衡とベルマン方程式の再帰的組み合わせを拡張して、最適なロボット ポリシーを解決します。
興味深いことに、協働ロボットが透明であることが常に最適であるわけではないことがわかりました。
代わりに、ロボットが不透明である場合、人間とロボットのチームはより高い報酬を達成できる場合があります。
透明なロボットとは対照的に、不透明なロボットは人間からの情報を差し控える行動を選択します。
私たちの分析は、(a) 人間とロボットの相互作用の期間が短い場合、または (b) ユーザーがロボットの動作から学習するのが遅い場合に、不透明な動作が最適になることを示唆しています。
私たちはこの理論分析を、オンラインと対面の両方の設定で合計 43 人の参加者にわたるユーザー調査に拡張しました。
私たちは、短いインタラクションの間、ユーザーは不透明なパートナーと作業するときにより高い報酬を獲得し、不透明なロボットを透明なロボットとほぼ同等であると主観的に評価していることがわかりました。
ここで実験のビデオをご覧ください: https://youtu.be/u8q1Z7WHUuI

要約(オリジナル)

We often assume that robots which collaborate with humans should behave in ways that are transparent (e.g., legible, explainable). These transparent robots intentionally choose actions that convey their internal state to nearby humans: for instance, a transparent robot might exaggerate its trajectory to indicate its goal. But while transparent behavior seems beneficial for human-robot interaction, is it actually optimal? In this paper we consider collaborative settings where the human and robot have the same objective, and the human is uncertain about the robot’s type (i.e., the robot’s internal state). We extend a recursive combination of Bayesian Nash equilibrium and the Bellman equation to solve for optimal robot policies. Interestingly, we discover that it is not always optimal for collaborative robots to be transparent; instead, human and robot teams can sometimes achieve higher rewards when the robot is opaque. In contrast to transparent robots, opaque robots select actions that withhold information from the human. Our analysis suggests that opaque behavior becomes optimal when either (a) human-robot interactions have a short time horizon or (b) users are slow to learn from the robot’s actions. We extend this theoretical analysis to user studies across 43 total participants in both online and in-person settings. We find that — during short interactions — users reach higher rewards when working with opaque partners, and subjectively rate opaque robots as about equal to transparent robots. See videos of our experiments here: https://youtu.be/u8q1Z7WHUuI

arxiv情報

著者 Shahabedin Sagheb,Soham Gandhi,Dylan P. Losey
発行日 2023-09-05 20:53:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク