要約
オークションなどの繰り返しのゲームでは、プレイヤーは通常、学習アルゴリズムを使用してアクションを選択します。
このような自律学習エージェントの使用は、オンラインプラットフォームで広まっています。
この論文では、エージェント間のダイナミクスを通じて彼らの好意に影響を与えることを目的とした、金融移転政策をエージェントのアルゴリズムに組み込むプレイヤーの影響を探ります。
私たちの焦点は、プレイヤーが金銭的転送を利用するインセンティブを持っていること、そのような支払いが学習ダイナミクスにどのように影響するか、そしてプレーヤー間の福祉とその分布にどのような影響を与えるかを理解することです。
このようなシナリオをキャプチャするために、シンプルで一般的なゲーム理論モデルを提案します。
一般的なゲームでの私たちの結果は、非常に幅広いゲームのゲームで、自己利益のプレイヤーがゲームのダイナミクス中に学習エージェントに他の学習者に支払いをさせることで利益を得ており、多くの場合、この種の行動はすべてのプレイヤーの福祉を改善することを示しています。
。
1枚目と2番目のオークションに関する私たちの結果は、「支払いポリシーゲーム」の平衡において、エージェントのダイナミクスが競売人の収益が低い強力な協力的な結果に達することを示しています。
これらの結果は、新しい質問を提起し、自動化された学習エージェントがデジタルエコシステムやメカニズムの境界の外側との対話から利益を得ることができるシステムのメカニズム設計の課題を強調しています。
要約(オリジナル)
In repeated games, such as auctions, players typically use learning algorithms to choose their actions. The use of such autonomous learning agents has become widespread on online platforms. In this paper, we explore the impact of players incorporating monetary transfer policies into their agents’ algorithms, aiming to influence behavior in their favor through the dynamics between the agents. Our focus is on understanding when players have incentives to make use of monetary transfers, how such payments may affect learning dynamics, and what the implications are for welfare and its distribution among the players. We propose a simple and general game-theoretic model to capture such scenarios. Our results on general games show that in a very broad class of games, self-interested players benefit from letting their learning agents make payments to other learners during the game dynamics, and that in many cases, this kind of behavior improves welfare for all players. Our results on first- and second-price auctions show that in equilibria of the “payment policy game,” the agents’ dynamics reach strong collusive outcomes with low revenue for the auctioneer. These results raise new questions and highlight a challenge for mechanism design in systems where automated learning agents can benefit from interacting with their peers in the digital ecosystem and outside the boundaries of the mechanism.
arxiv情報
著者 | Yoav Kolumbus,Joe Halpern,Éva Tardos |
発行日 | 2025-02-11 16:29:04+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google