Should Collaborative Robots be Transparent?

要約

私たちは、人間と協力するロボットが透明性のある方法で振る舞うべきであるとしばしば仮定します(例えば、読みやすく、説明可能)。
これらの透明なロボットは、内部状態を近くの人間に伝えるアクションを意図的に選択します。たとえば、透明なロボットは、その目標を示すために軌跡を誇張するかもしれません。
しかし、透明な行動は人間とロボットの相互作用に有益と思われますが、実際には最適ですか?
この論文では、人間とロボットが同じ目的を持っている共同設定を検討し、人間がロボットのタイプ(つまり、ロボットの内部状態)について不確かです。
ベイジアンナッシュ平衡とベルマン方程式の再帰的な組み合わせを拡張して、最適なロボットポリシーを解決します。
興味深いことに、共同ロボットが透明であることが常に最適ではないことがわかります。
代わりに、ロボットが不透明な場合、人間とロボットのチームはより高い報酬を達成することがあります。
透明なロボットとは対照的に、不透明なロボットは、人間からの情報を差し控えるアクションを選択します。
私たちの分析は、(a)人間とロボットの相互作用が短い時間を過ごした場合、または(b)ユーザーがロボットの行動から学ぶのが遅い場合、不透明な動作が最適になることを示唆しています。
この理論的分析は、オンラインと対面の両方の設定の43人の合計参加者にわたってユーザー研究に拡張します。
短いインタラクション中に、ユーザーは不透明なパートナーと協力するときにより高い報酬に到達し、透明なロボットに等しいと主観的に不透明なロボットを評価していることがわかります。
https://youtu.be/u8q1z7whuuiの実験のビデオを参照してください

要約(オリジナル)

We often assume that robots which collaborate with humans should behave in ways that are transparent (e.g., legible, explainable). These transparent robots intentionally choose actions that convey their internal state to nearby humans: for instance, a transparent robot might exaggerate its trajectory to indicate its goal. But while transparent behavior seems beneficial for human-robot interaction, is it actually optimal? In this paper we consider collaborative settings where the human and robot have the same objective, and the human is uncertain about the robot’s type (i.e., the robot’s internal state). We extend a recursive combination of Bayesian Nash equilibrium and the Bellman equation to solve for optimal robot policies. Interestingly, we discover that it is not always optimal for collaborative robots to be transparent; instead, human and robot teams can sometimes achieve higher rewards when the robot is opaque. In contrast to transparent robots, opaque robots select actions that withhold information from the human. Our analysis suggests that opaque behavior becomes optimal when either (a) human-robot interactions have a short time horizon or (b) users are slow to learn from the robot’s actions. We extend this theoretical analysis to user studies across 43 total participants in both online and in-person settings. We find that — during short interactions — users reach higher rewards when working with opaque partners, and subjectively rate opaque robots as about equal to transparent robots. See videos of our experiments here: https://youtu.be/u8q1Z7WHUuI

arxiv情報

著者 Shahabedin Sagheb,Soham Gandhi,Dylan P. Losey
発行日 2025-05-16 17:10:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク