要約
私たちは、エージェントが後悔のない学習アルゴリズムを使用して、繰り返されるオークションに参加する設定を研究しています。
\citet{kolumbus2022auctions} は、かなり驚くべきことに、入札者が後悔のない入札アルゴリズムを使用してセカンドプライス オークションに参加する場合、インタラクション $T$ の数がどれほど大きくても、次点の入札者が誠実に入札に収束しない可能性があることを示しました。
。
最初の結果は、これが \emph{一般決定的} 真実のオークションに当てはまることを示しています。
また、入札者の学習率の比率が入札者の収束に \emph{質的} 影響を与える可能性があることも示します。
次に、この環境における収益の最大化の問題を考えます。
完全に合理的な入札者を使用した設定では、\citet{myerson1981optimal} は、準備金のあるセカンドプライス オークションを使用することで収益を最大化できることを示しました。我々は、まったく対照的に、学習入札者を使用した設定では、\emph{ランダム化された} オークションが使用されることを示しました。
$T$ が十分に大きい場合、リザーブ付きのセカンドプライス オークションよりも厳密に優れた収益保証を得ることができます。
最後に、非漸近領域における収益の最大化を研究します。
私たちは、生み出された収益を、真実の入札によるセカンドプライス オークションの収益と比較する、{\em 競売人の後悔} という概念を定義します。
オークション開催者がインタラクション全体を通じて同じオークションを使用する必要がある場合、$\smash{\widetilde \Theta(T^{3/4})} という (ほぼ) 厳しいリグレス限界を示します。$ オークション開催者が途中でオークションを変更できる場合
インタラクションですが、入札を意識しない方法で、$\smash{\widetilde \Theta(\sqrt{T})} の (ほぼ) 厳しい境界を示します。$
要約(オリジナル)
We study a setting where agents use no-regret learning algorithms to participate in repeated auctions. \citet{kolumbus2022auctions} showed, rather surprisingly, that when bidders participate in second-price auctions using no-regret bidding algorithms, no matter how large the number of interactions $T$ is, the runner-up bidder may not converge to bidding truthfully. Our first result shows that this holds for \emph{general deterministic} truthful auctions. We also show that the ratio of the learning rates of the bidders can \emph{qualitatively} affect the convergence of the bidders. Next, we consider the problem of revenue maximization in this environment. In the setting with fully rational bidders, \citet{myerson1981optimal} showed that revenue can be maximized by using a second-price auction with reserves.We show that, in stark contrast, in our setting with learning bidders, \emph{randomized} auctions can have strictly better revenue guarantees than second-price auctions with reserves, when $T$ is large enough. Finally, we study revenue maximization in the non-asymptotic regime. We define a notion of {\em auctioneer regret} comparing the revenue generated to the revenue of a second price auction with truthful bids. When the auctioneer has to use the same auction throughout the interaction, we show an (almost) tight regret bound of $\smash{\widetilde \Theta(T^{3/4})}.$ If the auctioneer can change auctions during the interaction, but in a way that is oblivious to the bids, we show an (almost) tight bound of $\smash{\widetilde \Theta(\sqrt{T})}.$
arxiv情報
著者 | Gagan Aggarwal,Anupam Gupta,Andres Perlroth,Grigoris Velegkas |
発行日 | 2024-11-14 15:28:40+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google