Enhancing Robot Assistive Behaviour with Reinforcement Learning and Theory of Mind

要約

ユーザーの好みへの適応と、心の理論 (ToM) として知られる人間の信念や意図を推測および解釈する能力は、人間とロボットの効果的なコラボレーションを実現するための 2 つの重要な側面です。
その重要性にもかかわらず、ToM 能力を備えた適応ロボットの影響を調査した研究はほとんどありません。
この研究では、ToM 能力を備えたソーシャル ロボットがユーザーのパフォーマンスと認識にどのような影響を与えるかを調査するための探索的比較研究を紹介します。
2層のアーキテクチャを設計します。
最初の層の Q 学習エージェントは、ロボットのより高いレベルの動作を学習します。
2 番目の層では、ヒューリスティックベースの ToM がユーザーの意図する戦略を推測し、ロボットの支援を実装するだけでなく、ロボットの選択の背後にある動機を提供する責任を負います。
私たちは、ToM が可能な適応ロボット、またはそのような能力を持たないロボットと対話する 56 人の参加者を対象とした、現実世界の設定でユーザー調査を実施しました。
私たちの調査結果は、ToM状態の参加者はパフォーマンスが良く、ロボットの支援をより頻繁に受け入れ、ロボットの適応、予測、意図をより高いレベルで認識する能力を認識していることを示唆しています。
私たちの予備的な洞察は、将来の研究に情報を提供し、ToM 機能を備えた適応動作のためのより複雑な計算アーキテクチャを設計する道を開く可能性があります。

要約(オリジナル)

The adaptation to users’ preferences and the ability to infer and interpret humans’ beliefs and intents, which is known as the Theory of Mind (ToM), are two crucial aspects for achieving effective human-robot collaboration. Despite its importance, very few studies have investigated the impact of adaptive robots with ToM abilities. In this work, we present an exploratory comparative study to investigate how social robots equipped with ToM abilities impact users’ performance and perception. We design a two-layer architecture. The Q-learning agent on the first layer learns the robot’s higher-level behaviour. On the second layer, a heuristic-based ToM infers the user’s intended strategy and is responsible for implementing the robot’s assistance, as well as providing the motivation behind its choice. We conducted a user study in a real-world setting, involving 56 participants who interacted with either an adaptive robot capable of ToM, or with a robot lacking such abilities. Our findings suggest that participants in the ToM condition performed better, accepted the robot’s assistance more often, and perceived its ability to adapt, predict and recognise their intents to a higher degree. Our preliminary insights could inform future research and pave the way for designing more complex computation architectures for adaptive behaviour with ToM capabilities.

arxiv情報

著者 Antonio Andriella,Giovanni Falcone,Silvia Rossi
発行日 2024-11-11 14:01:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.HC, cs.RO パーマリンク