Repeated Bilateral Trade Against a Smoothed Adversary


適応的な $\sigma$-smooth 敵対者が売り手と買い手の評価を生成する繰り返しの二国間取引を研究します。
学習者が買い手と売り手に同じまたは異なる価格を投稿できる 2 つのケースで、異なるフィードバック モデルの下での固定価格メカニズムの後悔体制の完全な特徴付けを提供します。
$T$ ラウンド後のミニマックス リグリーメントは、フル フィードバック シナリオで $\sqrt{T}$ のオーダーであることを示すことから始めます。
ただし、学習者が各ラウンドで 2 つの異なる価格を投稿できる場合、対数因子を無視して注文 $T^{3/4}$ を後悔するアルゴリズムを設計します。
この論文の主な技術的貢献である驚くべき $T^{3/4}$ 下限を提示することにより、このレートが最適であることを証明します。


We study repeated bilateral trade where an adaptive $\sigma$-smooth adversary generates the valuations of sellers and buyers. We provide a complete characterization of the regret regimes for fixed-price mechanisms under different feedback models in the two cases where the learner can post either the same or different prices to buyers and sellers. We begin by showing that the minimax regret after $T$ rounds is of order $\sqrt{T}$ in the full-feedback scenario. Under partial feedback, any algorithm that has to post the same price to buyers and sellers suffers worst-case linear regret. However, when the learner can post two different prices at each round, we design an algorithm enjoying regret of order $T^{3/4}$ ignoring log factors. We prove that this rate is optimal by presenting a surprising $T^{3/4}$ lower bound, which is the main technical contribution of the paper.


著者 Nicolò Cesa-Bianchi,Tommaso Cesari,Roberto Colomboni,Federico Fusco,Stefano Leonardi
発行日 2023-02-21 16:30:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.DS, cs.GT, cs.LG パーマリンク