私たちは 2 つの異なる評価モデルに焦点を当てています。
1 つ目は、評価がコンテキストに線形に依存し、ノイズによってさらに歪められることを前提としています。
マイナーな規則性の仮定の下では、私たちのアルゴリズムは $\tilde{\mathcal{O}}(T^{2/3})$ の最適なリグレス限界を達成し、既存の結果を改善します。
2 番目のモデルは線形性の仮定を取り除き、予想される購入者の評価がコンテキスト内で $\beta$-H\’古いことのみを要求します。
このモデルの場合、アルゴリズムはリグレット $\tilde{\mathcal{O}}(T^{d+2\beta/d+3\beta})$ を取得します。ここで $d$ はコンテキスト空間の次元です。
In contextual dynamic pricing, a seller sequentially prices goods based on contextual information. Buyers will purchase products only if the prices are below their valuations. The goal of the seller is to design a pricing strategy that collects as much revenue as possible. We focus on two different valuation models. The first assumes that valuations linearly depend on the context and are further distorted by noise. Under minor regularity assumptions, our algorithm achieves an optimal regret bound of $\tilde{\mathcal{O}}(T^{2/3})$, improving the existing results. The second model removes the linearity assumption, requiring only that the expected buyer valuation is $\beta$-H\’older in the context. For this model, our algorithm obtains a regret $\tilde{\mathcal{O}}(T^{d+2\beta/d+3\beta})$, where $d$ is the dimension of the context space.
著者 | Matilde Tullii,Solenne Gaucher,Nadav Merlis,Vianney Perchet |
発行日 | 2025-01-15 15:07:59+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google