Strategizing against No-Regret Learners in First-Price Auctions


私たちは、2 人のプレイヤーの間で繰り返されるファーストプライス オークションと一般的な繰り返しベイジアン ゲームを研究します。この場合、一方のプレイヤーである学習者は後悔のない学習アルゴリズムを採用し、もう一方のプレイヤーである最適化者は学習者のアルゴリズムを知っていて、自身の有用性を最大化するように戦略を立てます。

平均値ベースのアルゴリズムと呼ばれる、一般的に使用されるクラスの後悔のない学習アルゴリズムについて、(i) 標準 (つまり、完全な情報) のファーストプライス オークションでは、オプティマイザーは Stackelberg ユーティリティ (標準) を超えるものを取得することはできないことを示します。
文献ではベンチマークですが、(ii) ベイジアン ファーストプライス オークションでは、オプティマイザーが Stackelberg ユーティリティよりもはるかに高いパフォーマンスを達成できる場合があります。
一方、Mansour et al。
(2022) は、no-polytope-swap-regret アルゴリズムと呼ばれる、より洗練されたクラスのアルゴリズムが、繰り返されるベイジアン ゲーム (ベイジアン ファーストプライス オークションを含む) において、Stackelberg ユーティリティでオプティマイザの有用性を制限するのに十分であることを示しました。
オプティマイザの有用性を制限するために no-polytope-swap-regret アルゴリズムが必要かどうかについては疑問があります。
一般的なベイジアン ゲームでは、合理的かつ必要な条件の下で、オプティマイザの有用性を制限するためにポリトープ スワップ リグレットなしのアルゴリズムが実際に必要であることを証明し、未解決の質問に答えます。
ベイジアン ファーストプライス オークションの場合、ベイジアン ファーストプライス オークションの構造を利用して、ポリトープ スワップの後悔を最小限に抑えるための標準アルゴリズムを簡単に改善します。


We study repeated first-price auctions and general repeated Bayesian games between two players, where one player, the learner, employs a no-regret learning algorithm, and the other player, the optimizer, knowing the learner’s algorithm, strategizes to maximize its own utility. For a commonly used class of no-regret learning algorithms called mean-based algorithms, we show that (i) in standard (i.e., full-information) first-price auctions, the optimizer cannot get more than the Stackelberg utility — a standard benchmark in the literature, but (ii) in Bayesian first-price auctions, there are instances where the optimizer can achieve much higher than the Stackelberg utility. On the other hand, Mansour et al. (2022) showed that a more sophisticated class of algorithms called no-polytope-swap-regret algorithms are sufficient to cap the optimizer’s utility at the Stackelberg utility in any repeated Bayesian game (including Bayesian first-price auctions), and they pose the open question whether no-polytope-swap-regret algorithms are necessary to cap the optimizer’s utility. For general Bayesian games, under a reasonable and necessary condition, we prove that no-polytope-swap-regret algorithms are indeed necessary to cap the optimizer’s utility and thus answer their open question. For Bayesian first-price auctions, we give a simple improvement of the standard algorithm for minimizing the polytope swap regret by exploiting the structure of Bayesian first-price auctions.


著者 Aviad Rubinstein,Junyao Zhao
発行日 2024-02-13 18:03:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.DS, cs.GT, cs.LG パーマリンク