Fairness-aware Online Price Discrimination with Nonparametric Demand Models

要約

価格差別化とは、顧客グループごとに異なる価格を設定する戦略を指し、オンライン小売業で広く使用されています。
これはオンライン小売業者の回収収入を増やすのに役立ちますが、公平性に関して深刻な懸念を引き起こす可能性があり、規制や法律に違反することさえあります。
この論文は、公平性の制約の下での動的な差別的な価格設定の問題を研究します。
特に、2 つの顧客グループに対する 1 つの製品について、長さ $T$ の有限販売期間を考慮します。
顧客の各グループには、学習する必要がある未知の需要関数があります。
販売期間ごとに、販売者はグループごとに価格を決定し、グループの購買行動を観察します。
既存の文献は主に収益の最大化に焦点を当てていますが、ダイナミックプライシングの文献では、さまざまな顧客間の公平性の確保については十分に検討されていません。
この研究では、Cohen らの公平性の概念が採用されています。
(2022年)。
価格の公平性のために、厳格な価格の公平性制約を強制するリグレットに関する最適な動的価格設定ポリシーを提案します。
オンライン学習における標準的な $\sqrt{T}$ 型の後悔とは対照的に、この場合の最適な後悔は $\tilde{O}(T^{4/5})$ であることを示します。
さらに、特殊なケースとして要求の公平性を含む、より一般的な公平性の概念にアルゴリズムを拡張します。
この一般的なクラスを処理するために、ソフトフェアネス制約を提案し、$\tilde{O}(T^{4/5})$ リグロングを達成する動的価格設定ポリシーを開発します。
また、私たちのアルゴリズム技術が、複数の顧客グループ間の公平性など、より一般的なシナリオに適応できることも実証します。

要約(オリジナル)

Price discrimination, which refers to the strategy of setting different prices for different customer groups, has been widely used in online retailing. Although it helps boost the collected revenue for online retailers, it might create serious concerns about fairness, which even violates the regulation and laws. This paper studies the problem of dynamic discriminatory pricing under fairness constraints. In particular, we consider a finite selling horizon of length $T$ for a single product with two groups of customers. Each group of customers has its unknown demand function that needs to be learned. For each selling period, the seller determines the price for each group and observes their purchase behavior. While existing literature mainly focuses on maximizing revenue, ensuring fairness among different customers has not been fully explored in the dynamic pricing literature. This work adopts the fairness notion from Cohen et al. (2022). For price fairness, we propose an optimal dynamic pricing policy regarding regret, which enforces the strict price fairness constraint. In contrast to the standard $\sqrt{T}$-type regret in online learning, we show that the optimal regret in our case is $\tilde{O}(T^{4/5})$. We further extend our algorithm to a more general notion of fairness, which includes demand fairness as a special case. To handle this general class, we propose a soft fairness constraint and develop a dynamic pricing policy that achieves $\tilde{O}(T^{4/5})$ regret. We also demonstrate that our algorithmic techniques can be adapted to more general scenarios such as fairness among multiple groups of customers.

arxiv情報

著者 Xi Chen,Jiameng Lyu,Xuan Zhang,Yuan Zhou
発行日 2023-07-28 14:22:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク