Degeneracy is OK: Logarithmic Regret for Network Revenue Management with Indiscrete Distributions

要約

私たちは、承認/拒否の決定と $T$ IID の到着に関する古典的なネットワーク収益管理 (NRM) 問題を研究します。
各到着が有限数の可能なカテゴリに該当する必要があり、それぞれが決定的なリソース消費ベクトルを持つが、一定の間隔にわたって連続的に分布するランダムな値を持つ分布形式を考えます。
このモデルの下で $O(\log^2 T)$ リグレスを達成するオンライン アルゴリズムを開発します。唯一の (必要な) 仮定は、確率密度が 0 から離れた範囲にあるということです。$O( を達成する 2 番目の結果を導き出します。
\log T)$ は、二次成長の追加仮定の下では残念です。
私たちの知る限り、これらは、いかなる種類の「非縮退」仮定も必要としない連続値を持つ NRM モデルで対数レベルのリグレスを達成した最初の結果です。
私たちの結果は、近視の後悔を境界付ける新しい方法、オフライン割り当ての「半流動的」緩和、および「二重輻輳」の改善された境界を含む新しい技術によって達成されました。

要約(オリジナル)

We study the classical Network Revenue Management (NRM) problem with accept/reject decisions and $T$ IID arrivals. We consider a distributional form where each arrival must fall under a finite number of possible categories, each with a deterministic resource consumption vector, but a random value distributed continuously over an interval. We develop an online algorithm that achieves $O(\log^2 T)$ regret under this model, with the only (necessary) assumption being that the probability densities are bounded away from 0. We derive a second result that achieves $O(\log T)$ regret under an additional assumption of second-order growth. To our knowledge, these are the first results achieving logarithmic-level regret in an NRM model with continuous values that do not require any kind of ‘non-degeneracy’ assumptions. Our results are achieved via new techniques including a new method of bounding myopic regret, a ‘semi-fluid’ relaxation of the offline allocation, and an improved bound on the ‘dual convergence’.

arxiv情報

著者 Jiashuo Jiang,Will Ma,Jiawei Zhang
発行日 2025-01-02 16:07:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, math.PR パーマリンク