Learning-Based Pricing and Matching for Two-Sided Queues

要約

複数の種類の顧客とサーバーを含む動的なシステムを検討します。
待機中の顧客またはサーバーの各タイプは個別のキューに参加し、顧客側のキューとサーバー側のキューからなる 2 部グラフを形成します。
サーバーと顧客のタイプに互換性がある場合、プラットフォームはサーバーと顧客を照合できます。
一致したペアはシステムから出ます。
プラットフォームは、顧客が到着したときにそのタイプに応じた価格を請求し、サーバーにそのタイプに応じた価格を支払います。
各キューの到着率は、未知の需要または供給関数に応じた価格によって決定されます。
私たちの目標は、顧客とサーバーの両方のキューの長さを所定のしきい値未満に保ちながら、未知の需要と供給機能でプラットフォームの利益を最大化するように価格設定とマッチングのアルゴリズムを設計することです。
このシステムは、乗客とドライバーによるライドシェア市場などの両面市場をモデル化するために使用できます。
この問題の難しさには、学習と意思決定を同時に行うこと、および利益の最大化とキューの長さの最小化の間のトレードオフが含まれます。
私たちは最長キュー優先マッチング アルゴリズムを使用し、勾配のない確率的投影勾配上昇と二分探索を組み合わせた学習ベースの価格設定アルゴリズムを提案します。
私たちの提案したアルゴリズムが線形未満のリグレット $\tilde{O}(T^{5/6})$ とキュー長制限 $\tilde{O}(T^{1/6})$ を生成することを証明します。
$T$ は時間軸です。
さらに、リグレス限界とキュー長限界の間のトレードオフを確立します: $\tilde{O}(T^{1-\gamma})$ と $\tilde{O}(T^{\gamma})$
$\ガンマ \in (0, 1/6].$

要約(オリジナル)

We consider a dynamic system with multiple types of customers and servers. Each type of waiting customer or server joins a separate queue, forming a bipartite graph with customer-side queues and server-side queues. The platform can match the servers and customers if their types are compatible. The matched pairs then leave the system. The platform will charge a customer a price according to their type when they arrive and will pay a server a price according to their type. The arrival rate of each queue is determined by the price according to some unknown demand or supply functions. Our goal is to design pricing and matching algorithms to maximize the profit of the platform with unknown demand and supply functions, while keeping queue lengths of both customers and servers below a predetermined threshold. This system can be used to model two-sided markets such as ride-sharing markets with passengers and drivers. The difficulties of the problem include simultaneous learning and decision making, and the tradeoff between maximizing profit and minimizing queue length. We use a longest-queue-first matching algorithm and propose a learning-based pricing algorithm, which combines gradient-free stochastic projected gradient ascent with bisection search. We prove that our proposed algorithm yields a sublinear regret $\tilde{O}(T^{5/6})$ and anytime queue-length bound $\tilde{O}(T^{1/6})$, where $T$ is the time horizon. We further establish a tradeoff between the regret bound and the queue-length bound: $\tilde{O}(T^{1-\gamma})$ versus $\tilde{O}(T^{\gamma})$ for $\gamma \in (0, 1/6].$

arxiv情報

著者 Zixian Yang,Lei Ying
発行日 2024-11-18 17:58:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, math.OC, math.PR パーマリンク