要約
我々は、Crawford and Sobel (1982)の戦略的情報伝達ゲームを行う2つの独立した強化学習アルゴリズムの振る舞いをシミュレートする。大規模な母集団が匿名で相互作用する静的ゲームにおける学習を捉えるために、メモリレスアルゴリズムを採用する。送り手と受け手がナッシュ均衡に収束することを示す。送り手のチープトークの情報量は、バイアスが大きくなるにつれて減少し、バイアスの中間レベルでは、パレート最適均衡またはセカンドベスト均衡によって予測されるレベルと一致する。結論は、学習のハイパーパラメータとゲームの別の仕様に対して頑健である。
要約(オリジナル)
We simulate behaviour of two independent reinforcement learning algorithms playing the Crawford and Sobel (1982) game of strategic information transmission. We adopt memoryless algorithms to capture learning in a static game where a large population interacts anonymously. We show that sender and receiver converge to Nash equilibrium play. The level of informativeness of the sender’s cheap talk decreases as the bias increases and, at intermediate level of the bias, it matches the level predicted by the Pareto optimal equilibrium or by the second best one. Conclusions are robust to alternative specifications of the learning hyperparameters and of the game.
arxiv情報
著者 | Daniele Condorelli,Massimiliano Furlan |
発行日 | 2024-06-03 15:34:10+00:00 |
arxivサイト | arxiv_id(pdf) |