要約
私たちは、オンライン広告プラットフォームで競合する自動入札アルゴリズム間のゲームを研究しています。
各自動入札者は、予算と投資収益率の制約に従って、繰り返されるオークションの複数ラウンドにわたって広告主の合計価値を最大化するという任務を負っています。
私たちは、すべての制約を満たすことが保証され、個人の後悔の消滅を達成する勾配ベースの学習アルゴリズムを提案します。
私たちのアルゴリズムはバンディット フィードバックのみを使用し、ファーストプライスまたはセカンドプライス オークションだけでなく、あらゆる「中間」オークション形式でも使用できます。
私たちの主な結果は、これらの自動入札者が互いに対戦する場合、結果として生じるすべてのラウンドにわたる予想されるリキッド ウェルフェアが、任意の割り当てによって達成される予想される最適なリキッド ウェルフェアの少なくとも半分であるということです。
これは、入札力学が均衡に収束するかどうかに関係します。
要約(オリジナル)
We study a game between autobidding algorithms that compete in an online advertising platform. Each autobidder is tasked with maximizing its advertiser’s total value over multiple rounds of a repeated auction, subject to budget and return-on-investment constraints. We propose a gradient-based learning algorithm that is guaranteed to satisfy all constraints and achieves vanishing individual regret. Our algorithm uses only bandit feedback and can be used with the first- or second-price auction, as well as with any ‘intermediate’ auction format. Our main result is that when these autobidders play against each other, the resulting expected liquid welfare over all rounds is at least half of the expected optimal liquid welfare achieved by any allocation. This holds whether or not the bidding dynamics converges to an equilibrium.
arxiv情報
著者 | Brendan Lucier,Sarath Pattathil,Aleksandrs Slivkins,Mengxiao Zhang |
発行日 | 2024-12-02 14:13:35+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google