要約
この論文では、相互の認識のための本質的な動機を探り、人間は外因性の報酬がない場合でも理解し、理解されるための基本的な意欲を持っていると仮定しています。
知覚交差パラダイムのシミュレーションを通じて、強化学習エージェントにおけるさまざまな内部報酬機能の効果を調査します。
理解するためのドライブは、積極的な推論タイプの人工的な好奇心の報酬として実装されますが、理解されるドライブは、模倣、影響/印象性、および他者のサブ反応時間予測に対する本質的な報酬を通じて実装されます。
結果は、人工的な好奇心だけでは社会的相互作用の好みにつながるわけではないが、相互の理解が相互作用に優先順位を付けるように促進することを強調することを報酬であることを示しています。
この本質的な動機は、他の行動に対して外因性の報酬を受け取るエージェントが1人のエージェントだけであるタスクの協力を促進できることを実証します。
要約(オリジナル)
This paper explores an intrinsic motivation for mutual awareness, hypothesizing that humans possess a fundamental drive to understand and to be understood even in the absence of extrinsic rewards. Through simulations of the perceptual crossing paradigm, we explore the effect of various internal reward functions in reinforcement learning agents. The drive to understand is implemented as an active inference type artificial curiosity reward, whereas the drive to be understood is implemented through intrinsic rewards for imitation, influence/impressionability, and sub-reaction time anticipation of the other. Results indicate that while artificial curiosity alone does not lead to a preference for social interaction, rewards emphasizing reciprocal understanding successfully drive agents to prioritize interaction. We demonstrate that this intrinsic motivation can facilitate cooperation in tasks where only one agent receives extrinsic reward for the behaviour of the other.
arxiv情報
著者 | Chrisantha Fernando,Dylan Banarse,Simon Osindero |
発行日 | 2025-04-10 07:46:00+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google