要約
戦略的情報伝達の Crawford and Sobel (1982) ゲームをプレイする 2 つの独立した強化学習アルゴリズムの動作をシミュレートします。
私たちはメモリレス アルゴリズムを採用し、大規模な集団が匿名で対話する静的なゲームでの学習をキャプチャします。
送信者と受信者がナッシュ均衡遊びに収束することを示します。
送信者の安っぽいトークの有益性のレベルは、バイアスが増加するにつれて減少し、バイアスの中間レベルでは、パレート最適均衡または 2 番目に最適な均衡によって予測されるレベルと一致します。
結論は、学習ハイパーパラメータとゲームの代替仕様に対して堅牢です。
要約(オリジナル)
We simulate behaviour of two independent reinforcement learning algorithms playing the Crawford and Sobel (1982) game of strategic information transmission. We adopt memoryless algorithms to capture learning in a static game where a large population interacts anonymously. We show that sender and receiver converge to Nash equilibrium play. The level of informativeness of the sender’s cheap talk decreases as the bias increases and, at intermediate level of the bias, it matches the level predicted by the Pareto optimal equilibrium or by the second best one. Conclusions are robust to alternative specifications of the learning hyperparameters and of the game.
arxiv情報
著者 | Daniele Condorelli,Massimiliano Furlan |
発行日 | 2024-10-01 10:46:26+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google