A Conformal Approach to Feature-based Newsvendor under Model Misspecification

要約

データ駆動型の意思決定に関する多くの問題では、パフォーマンスの保証はモデルの仮定の正しさに大きく依存することが多く、実際にはモデルの仮定が失敗することがよくあります。
私たちは、需要が人口動態や季節性などの観測された特徴によって影響を受ける、特集ベースのニュースベンダー問題の文脈でこの問題に取り組みます。
モデルの仕様ミスの影響を軽減するために、等角予測にヒントを得たモデルフリーかつ分布フリーのフレームワークを提案します。
私たちのアプローチは、あらゆるタイプの予測方法を利用できるトレーニング フェーズと、モデルのバイアスを等形化するキャリブレーション フェーズの 2 つのフェーズで構成されます。
予測パフォーマンスを向上させるために、固有のトレードオフを認識しながら、データの品質と量のバランスを調査します。トレーニング データの選択性を高めると、品質は向上しますが、量は減少します。
重要なのは、基礎となるモデルの正確さに関係なく、等角化された臨界分位数に対して統計的保証を提供することです。
さらに、データの品質と量が向上するにつれて幅が減少する臨界分位値の信頼区間を定量化します。
私たちは、シミュレートされたデータと、ワシントン D.C. の Capital Bikeshare プログラムからの現実世界のデータセットの両方を使用してフレームワークを検証します。これらの実験全体を通じて、私たちが提案した手法は一貫してベンチマーク アルゴリズムを上回り、シミュレートされたデータでは最大 40%、ニュースベンダーの損失は 25% 削減されました。
現実世界のデータセット上で。

要約(オリジナル)

In many data-driven decision-making problems, performance guarantees often depend heavily on the correctness of model assumptions, which may frequently fail in practice. We address this issue in the context of a feature-based newsvendor problem, where demand is influenced by observed features such as demographics and seasonality. To mitigate the impact of model misspecification, we propose a model-free and distribution-free framework inspired by conformal prediction. Our approach consists of two phases: a training phase, which can utilize any type of prediction method, and a calibration phase that conformalizes the model bias. To enhance predictive performance, we explore the balance between data quality and quantity, recognizing the inherent trade-off: more selective training data improves quality but reduces quantity. Importantly, we provide statistical guarantees for the conformalized critical quantile, independent of the correctness of the underlying model. Moreover, we quantify the confidence interval of the critical quantile, with its width decreasing as data quality and quantity improve. We validate our framework using both simulated data and a real-world dataset from the Capital Bikeshare program in Washington, D.C. Across these experiments, our proposed method consistently outperforms benchmark algorithms, reducing newsvendor loss by up to 40% on the simulated data and 25% on the real-world dataset.

arxiv情報

著者 Junyu Cao
発行日 2024-12-17 18:34:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク