Cheap Talking Algorithms

要約

戦略的情報伝達の Crawford and Sobel (1982) ゲームをプレイする独立した強化学習アルゴリズムの動作をシミュレートします。
送信者と受信者が一緒にトレーニングすると、ゲームの事前の最適な均衡に近い戦略に収束することを示します。
したがって、コミュニケーションはナッシュ均衡によって予測される最大限の範囲で行われます。
結論は、学習ハイパーパラメータとゲームの代替仕様に対して堅牢です。
私たちは、情報伝達ゲームにおける均衡選択の理論、コンピューターサイエンスにおけるアルゴリズム間の新たな通信に関する研究、および人工知能エージェントが存在する市場における共謀の経済学への影響について議論します。

要約(オリジナル)

We simulate behavior of independent reinforcement learning algorithms playing the Crawford and Sobel (1982) game of strategic information transmission. We show that a sender and a receiver training together converge to strategies close to the ex-ante optimal equilibrium of the game. Hence, communication takes place to the largest extent predicted by Nash equilibrium. The conclusion is robust to alternative specifications of the learning hyperparameters and of the game. We discuss implications for theories of equilibrium selection in information transmission games, for work on emerging communication among algorithms in computer science, and for the economics of collusions in markets populated by artificially intelligent agents.

arxiv情報

著者 Daniele Condorelli,Massimiliano Furlan
発行日 2023-11-09 13:43:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, econ.TH パーマリンク