Leveraging Reviews: Learning to Price with Buyer and Seller Uncertainty

要約

オンライン マーケットプレイスでは、顧客は 1 つの製品について何百ものレビューにアクセスできます。
購入者は、衣服の身長、スキンケア製品の肌質、屋外用家具の場所など、自分と同じタイプの他の顧客からのレビューを使用して、先験的に把握していない可能性のある価値を推定することがよくあります。
関連するレビューがほとんどない顧客は、低価格以外では購入をためらう可能性があるため、売り手としては、高い価格を設定することと、購入者が自信を持って価値を見積もることができるように十分なレビューを確保することとの間に緊張感があります。
同時に、売り手はレビューを使用して、売りたい商品の需要を測ることができます。
この研究では、売り手が一連の $T$ ラウンドにわたって有限の多くの種類の買い手のセットと 1 人ずつ対話するオンライン設定で、この価格設定の問題を研究します。
各ラウンドで、売り手は最初に価格を設定します。
その後、購入者が到着し、同じタイプの以前の購入者のレビューを調べ、それらの購入者の事後価値が明らかになります。
購入者はレビューに基づいて、事前の有用性がプラスであると信じる十分な理由がある場合に購入を決定します。
重要なことは、売り手は価格を設定するときに買い手のタイプを把握しておらず、タイプ間の分布さえも知りません。
当社は、販売者が高い収益を得るために使用できる後悔のないアルゴリズムを提供します。
$d$ 型がある場合、$T$ ラウンドの後、アルゴリズムは問題に依存しない $\tilde O(T^{2/3}d^{1/3})$ リグレット限界を達成します。
ただし、特定の型が出現する最小確率 $q_{\text{min}}$ が大きい場合、特に $q_{\text{min}} \in \Omega(d^{-2/3}T^ の場合)
{-1/3})$ の場合、同じアルゴリズムで $\チルダ O(T^{1/2}q_{\text{min}}^{-1/2})$ の後悔限界が達成されます。
これらの上限を両方の領域で一致する下限で補完し、アルゴリズムが下位の項までミニマックス最適であることを示します。

要約(オリジナル)

In online marketplaces, customers have access to hundreds of reviews for a single product. Buyers often use reviews from other customers that share their type — such as height for clothing, skin type for skincare products, and location for outdoor furniture — to estimate their values, which they may not know a priori. Customers with few relevant reviews may hesitate to make a purchase except at a low price, so for the seller, there is a tension between setting high prices and ensuring that there are enough reviews so that buyers can confidently estimate their values. Simultaneously, sellers may use reviews to gauge the demand for items they wish to sell. In this work, we study this pricing problem in an online setting where the seller interacts with a set of buyers of finitely many types, one by one, over a series of $T$ rounds. At each round, the seller first sets a price. Then a buyer arrives and examines the reviews of the previous buyers with the same type, which reveal those buyers’ ex-post values. Based on the reviews, the buyer decides to purchase if they have good reason to believe that their ex-ante utility is positive. Crucially, the seller does not know the buyer’s type when setting the price, nor even the distribution over types. We provide a no-regret algorithm that the seller can use to obtain high revenue. When there are $d$ types, after $T$ rounds, our algorithm achieves a problem-independent $\tilde O(T^{2/3}d^{1/3})$ regret bound. However, when the smallest probability $q_{\text{min}}$ that any given type appears is large, specifically when $q_{\text{min}} \in \Omega(d^{-2/3}T^{-1/3})$, then the same algorithm achieves a $\tilde O(T^{1/2}q_{\text{min}}^{-1/2})$ regret bound. We complement these upper bounds with matching lower bounds in both regimes, showing that our algorithm is minimax optimal up to lower-order terms.

arxiv情報

著者 Wenshuo Guo,Nika Haghtalab,Kirthevasan Kandasamy,Ellen Vitercik
発行日 2023-09-11 14:19:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.GT, cs.LG パーマリンク