Balanced Off-Policy Evaluation for Personalized Pricing

要約

機能情報、過去の価格設定決定、およびバイナリ実現需要で構成されるデータを使用して、パーソナライズされた価格設定の問題を検討します。
目標は、機能を価格にマッピングする新しいパーソナライズされた価格設定ポリシーのポリシー外評価を実行することです。
ポリシー外の評価のための逆傾向加重 (二重ロバストな方法を含む) に基づく方法は、ログ記録ポリシーがほとんど調査されていないか、決定論的である場合、パフォーマンスが低下する可能性があります。これは、価格設定アプリケーションでは一般的です。
Kallus (2018) のバランスの取れたポリシー評価フレームワークに基づいて、価格設定アプリケーションに合わせた新しいアプローチを提案します。
重要なアイデアは、最悪の場合の平均二乗誤差を最小化するか、最悪の場合の政策パフォーマンスの下限を最大化する推定値を計算することです。どちらの場合も、可能な収益関数のセットに関して最悪のケースが採用されます。
理論的な収束保証を確立し、実際の価格設定データセットを使用してアプローチの利点を実証します。

要約(オリジナル)

We consider a personalized pricing problem in which we have data consisting of feature information, historical pricing decisions, and binary realized demand. The goal is to perform off-policy evaluation for a new personalized pricing policy that maps features to prices. Methods based on inverse propensity weighting (including doubly robust methods) for off-policy evaluation may perform poorly when the logging policy has little exploration or is deterministic, which is common in pricing applications. Building on the balanced policy evaluation framework of Kallus (2018), we propose a new approach tailored to pricing applications. The key idea is to compute an estimate that minimizes the worst-case mean squared error or maximizes a worst-case lower bound on policy performance, where in both cases the worst-case is taken with respect to a set of possible revenue functions. We establish theoretical convergence guarantees and empirically demonstrate the advantage of our approach using a real-world pricing dataset.

arxiv情報

著者 Adam N. Elmachtoub,Vishal Gupta,Yunfan Zhao
発行日 2023-02-24 16:44:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク