Degeneracy is OK: Logarithmic Regret for Network Revenue Management with Indiscrete Distributions


私たちは、承認/拒否の決定と $T$ IID の到着に関する古典的なネットワーク収益管理 (NRM) 問題を研究します。
このモデルの下で $O(\log^2 T)$ リグレスを達成するオンライン アルゴリズムを開発します。唯一の (必要な) 仮定は、確率密度が 0 から離れた範囲にあるということです。$O( を達成する 2 番目の結果を導き出します。
\log T)$ は、二次成長の追加仮定の下では残念です。
私たちの知る限り、これらは、いかなる種類の「非縮退」仮定も必要としない連続値を持つ NRM モデルで対数レベルのリグレスを達成した最初の結果です。


We study the classical Network Revenue Management (NRM) problem with accept/reject decisions and $T$ IID arrivals. We consider a distributional form where each arrival must fall under a finite number of possible categories, each with a deterministic resource consumption vector, but a random value distributed continuously over an interval. We develop an online algorithm that achieves $O(\log^2 T)$ regret under this model, with the only (necessary) assumption being that the probability densities are bounded away from 0. We derive a second result that achieves $O(\log T)$ regret under an additional assumption of second-order growth. To our knowledge, these are the first results achieving logarithmic-level regret in an NRM model with continuous values that do not require any kind of ‘non-degeneracy’ assumptions. Our results are achieved via new techniques including a new method of bounding myopic regret, a ‘semi-fluid’ relaxation of the offline allocation, and an improved bound on the ‘dual convergence’.


著者 Jiashuo Jiang,Will Ma,Jiawei Zhang
発行日 2025-01-02 16:07:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.LG, math.PR パーマリンク