A multi-agent reinforcement learning model of reputation and cooperation in human groups

要約

集団行動は、個人が、いつ、どこで、どれだけ協力するかを効率的に調整することを要求します。
実験室での実験では、このプロセスの最初の部分が広く調査されており、さまざまな社会的認知メカニズムが、個人がグループの努力に投資することを選択する方法に影響を与えることが示されています.
しかし、実験的研究では、社会的認知メカニズムが集団行動の場所と時期にどのように寄与するかを明らかにすることはできませんでした.
マルチエージェント強化学習研究で一般的な社会的ジレンマタスクである Clean Up での人間の行動の計算モデルを構築してテストします。
人間のグループは、グループ メンバーを特定し、評判を経時的に追跡できる場合、Clean Up で効果的に協力しますが、匿名の条件下では組織化に失敗します。
評判のマルチエージェント強化学習モデルは、識別可能性と匿名性の条件下での協力における同じ違いを示しています。
さらに、このモデルは集団行動の空間的および時間的パターンを正確に予測します。この公共財のジレンマでは、評判に対する内在的な動機が、集団行動を調整するための非領土的で交代制の戦略の開発を触媒します。

要約(オリジナル)

Collective action demands that individuals efficiently coordinate how much, where, and when to cooperate. Laboratory experiments have extensively explored the first part of this process, demonstrating that a variety of social-cognitive mechanisms influence how much individuals choose to invest in group efforts. However, experimental research has been unable to shed light on how social cognitive mechanisms contribute to the where and when of collective action. We build and test a computational model of human behavior in Clean Up, a social dilemma task popular in multi-agent reinforcement learning research. We show that human groups effectively cooperate in Clean Up when they can identify group members and track reputations over time, but fail to organize under conditions of anonymity. A multi-agent reinforcement learning model of reputation demonstrates the same difference in cooperation under conditions of identifiability and anonymity. In addition, the model accurately predicts spatial and temporal patterns of group behavior: in this public goods dilemma, the intrinsic motivation for reputation catalyzes the development of a non-territorial, turn-taking strategy to coordinate collective action.

arxiv情報

著者 Kevin R. McKee,Edward Hughes,Tina O. Zhu,Martin J. Chadwick,Raphael Koster,Antonio Garcia Castaneda,Charlie Beattie,Thore Graepel,Matt Botvinick,Joel Z. Leibo
発行日 2023-02-22 12:22:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.GT, cs.MA パーマリンク