Cheap Talking Algorithms

要約

戦略的情報伝達の Crawford and Sobel (1982) ゲームをプレイする独立した強化学習アルゴリズムの動作をシミュレートします。
送信者と受信者が一緒にトレーニングすると、ゲームの事前の最適な均衡に近似する戦略に収束することを示します。
コミュニケーションは、ナッシュ均衡によって予測される最大限の範囲で発生します。
結論は、学習ハイパーパラメータとゲームの代替仕様に対して堅牢です。
私たちは、情報伝達ゲームにおける均衡選択の理論、コンピューターサイエンスにおけるアルゴリズム間の新たなコミュニケーションに関する研究、および人工知能エージェントが存在する市場における共謀の経済学への影響について議論します。

要約(オリジナル)

We simulate behaviour of independent reinforcement learning algorithms playing the Crawford and Sobel (1982) game of strategic information transmission. We show that a sender and a receiver training together converge to strategies approximating the ex-ante optimal equilibrium of the game. Communication occurs to the largest extent predicted by Nash equilibrium. The conclusion is robust to alternative specifications of the learning hyperparameters and of the game. We discuss implications for theories of equilibrium selection in information transmission games, for work on emerging communication among algorithms in computer science, and for the economics of collusions in markets populated by artificially intelligent agents.

arxiv情報

著者 Daniele Condorelli,Massimiliano Furlan
発行日 2023-12-11 18:08:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, econ.TH パーマリンク