要約
予算制約の入札者が、累積的なペイオフを最大化するために、繰り返される第一価格のオークションに適応的に入札することをどのように学ぶべきかを研究します。
この問題は、最近の2番目の価格のオークションからディスプレイ広告の第一価格のオークションへの業界全体の移行により発生しました。
入札者が予算を消費するにつれて、予算の制約のための二重変数を維持する簡単なデュアル勾配ベースの入札ポリシーを提案します。
分析では、将来の彼女の私的価値に関する入札者の知識に関する2つの設定を検討します。(i)すべての分布知識(非定常)が入札者に完全に知られていない情報のない設定と、(ii)予算配分の予測が事前に予測される有益な設定。
確率に関する完全な情報を使用して、最適なポリシーと比較して、パフォーマンスの損失(または後悔)を特徴付けます。
情報のない設定の場合、後悔は\ Tilde {o}(\ sqrt {t})と、価値分布の非定常性を反映する変動用語であることを示します。これは最適な順序です。
次に、予測の助けを借りてバリエーション用語を取り除くことができることを示します。
具体的には、後悔は\ tilde {o}(\ sqrt {t})に加えて、有益な設定の予測誤差項です。
要約(オリジナル)
We study how a budget-constrained bidder should learn to adaptively bid in repeated first-price auctions to maximize her cumulative payoff. This problem arose due to an industry-wide shift from second-price auctions to first-price auctions in display advertising recently, which renders truthful bidding (i.e., always bidding one’s private value) no longer optimal. We propose a simple dual-gradient-descent-based bidding policy that maintains a dual variable for budget constraint as the bidder consumes her budget. In analysis, we consider two settings regarding the bidder’s knowledge of her private values in the future: (i) an uninformative setting where all the distributional knowledge (can be non-stationary) is entirely unknown to the bidder, and (ii) an informative setting where a prediction of the budget allocation in advance. We characterize the performance loss (or regret) relative to an optimal policy with complete information on the stochasticity. For uninformative setting, We show that the regret is \tilde{O}(\sqrt{T}) plus a variation term that reflects the non-stationarity of the value distributions, and this is of optimal order. We then show that we can get rid of the variation term with the help of the prediction; specifically, the regret is \tilde{O}(\sqrt{T}) plus the prediction error term in the informative setting.
arxiv情報
著者 | Yige Wang,Jiashuo Jiang |
発行日 | 2025-05-05 17:13:02+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google