Private Optimal Inventory Policy Learning for Feature-based Newsvendor with Unknown Demand

要約

小売、サプライ チェーン、電子商取引、ヘルスケアなどのさまざまなセクターにわたるデータの急増により、ニュースベンダーの機能に関するデータドリブンの問題が最近重要な研究分野として浮上しています。
特徴ベースの分析でよく使用される顧客データや組織データの機密性を考慮すると、信頼と信頼を維持するには個人のプライバシーを確​​保することが重要です。
その重要性にもかかわらず、在庫計画におけるプライバシー保護は未開拓のままです。
主要な課題は、ニュースベンダー損失関数の非滑らかさであり、これが他の環境におけるプライバシー保護アルゴリズムに関する既存の研究とは一線を画すものとなっている。
この論文では、いくつかの魅力的な特性を備えた古典的な $(\epsilon, \delta)$-差分プライバシーの拡張である f-差分プライバシー フレームワーク内でプライバシーを保護する最適なインベントリ ポリシーを推定するための新しいアプローチを紹介します。
私たちは、次の 3 つの主要な課題に同時に対処するために、最適な在庫推定のための畳み込み平滑化に基づくクリップされたノイズを含む勾配降下法アルゴリズムを開発します。(1) 未知の需要分布と非滑らかな損失関数。
(2) 個人レベルのデータに対する証明可能なプライバシー保証。
(3) 望ましい統計的精度。
最適なポリシーパラメータ推定とリグロング分析のための有限サンプルの高確率限界を導き出します。
ニュースベンダー問題の構造を活用することで、一般的な非滑らかな凸損失に対する既存の結果を無差別に適用して得られるものと比較して、より高速な超過集団リスク限界を達成します。
私たちの限界は、強く凸で滑らかな損失関数の限界と一致しています。
私たちの数値実験は、提案された新しい方法がコストのわずかな増加で望ましいプライバシー保護を達成できることを示しています。

要約(オリジナル)

The data-driven newsvendor problem with features has recently emerged as a significant area of research, driven by the proliferation of data across various sectors such as retail, supply chains, e-commerce, and healthcare. Given the sensitive nature of customer or organizational data often used in feature-based analysis, it is crucial to ensure individual privacy to uphold trust and confidence. Despite its importance, privacy preservation in the context of inventory planning remains unexplored. A key challenge is the nonsmoothness of the newsvendor loss function, which sets it apart from existing work on privacy-preserving algorithms in other settings. This paper introduces a novel approach to estimate a privacy-preserving optimal inventory policy within the f-differential privacy framework, an extension of the classical $(\epsilon, \delta)$-differential privacy with several appealing properties. We develop a clipped noisy gradient descent algorithm based on convolution smoothing for optimal inventory estimation to simultaneously address three main challenges: (1) unknown demand distribution and nonsmooth loss function; (2) provable privacy guarantees for individual-level data; and (3) desirable statistical precision. We derive finite-sample high-probability bounds for optimal policy parameter estimation and regret analysis. By leveraging the structure of the newsvendor problem, we attain a faster excess population risk bound compared to that obtained from an indiscriminate application of existing results for general nonsmooth convex loss. Our bound aligns with that for strongly convex and smooth loss function. Our numerical experiments demonstrate that the proposed new method can achieve desirable privacy protection with a marginal increase in cost.

arxiv情報

著者 Tuoyi Zhao,Wen-xin Zhou,Lan Wang
発行日 2024-04-23 19:15:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク