Enhancing Retail Sales Forecasting with Optimized Machine Learning Models

要約

小売売上予測では、将来の売上を正確に予測することが、在庫管理と戦略計画にとって重要です。
LR などの従来の方法では、季節性や多数の製品ファミリーを含む販売データの複雑さにより、不十分なことがよくあります。
機械学習 (ML) の最近の進歩により、より堅牢な代替手段が提供されます。
この研究では、ML、特にランダム フォレスト (RF)、勾配ブースティング (GB)、サポート ベクター回帰 (SVR)、および XGBoost の力を活用して、予測精度を向上させています。
進歩にもかかわらず、季節性の高い複雑なデータセットや複数の製品ファミリーの処理には大きなギャップが存在します。
提案されたソリューションには、ランダム化検索相互検証によるハイパーパラメーター調整を活用した、RF モデルの実装と最適化が含まれます。
このアプローチはデータセットの複雑さに対処し、従来の方法では見逃していた複雑なパターンを捕捉します。
最適化された RF モデルは、R 二乗値 0.945 を達成しました。これは、初期 RF モデルおよび従来の LR の R 二乗値 0.531 よりも大幅に高かったです。
このモデルは二乗平均平方根対数誤差 (RMSLE) を 1.172 に削減し、その優れた予測能力を実証しました。
最適化された RF モデルは、Gradient Boosting (R 二乗: 0.942)、SVR (R 二乗: 0.940)、XGBoost (R 二乗: 0.939) などの最先端のモデルよりも優れた結果を示しましたが、平均二乗誤差 (MSE) はより多くありました。
および平均絶対誤差 (MAE) 数値。
結果は、最適化された RF モデルが小売売上高の予測に優れており、複雑なデータセットをより高い精度と信頼性で処理できることを示しています。
この研究は、予測分析における高度な ML 技術の重要性を強調し、従来の手法やその他の現代モデルに比べて大幅な改善をもたらします。

要約(オリジナル)

In retail sales forecasting, accurately predicting future sales is crucial for inventory management and strategic planning. Traditional methods like LR often fall short due to the complexity of sales data, which includes seasonality and numerous product families. Recent advancements in machine learning (ML) provide more robust alternatives. This research benefits from the power of ML, particularly Random Forest (RF), Gradient Boosting (GB), Support Vector Regression (SVR), and XGBoost, to improve prediction accuracy. Despite advancements, a significant gap exists in handling complex datasets with high seasonality and multiple product families. The proposed solution involves implementing and optimizing a RF model, leveraging hyperparameter tuning through randomized search cross-validation. This approach addresses the complexities of the dataset, capturing intricate patterns that traditional methods miss. The optimized RF model achieved an R-squared value of 0.945, substantially higher than the initial RF model and traditional LR, which had an R-squared of 0.531. The model reduced the root mean squared logarithmic error (RMSLE) to 1.172, demonstrating its superior predictive capability. The optimized RF model did better than cutting-edge models like Gradient Boosting (R-squared: 0.942), SVR (R-squared: 0.940), and XGBoost (R-squared: 0.939), with more minor mean squared error (MSE) and mean absolute error (MAE) numbers. The results demonstrate that the optimized RF model excels in forecasting retail sales, handling the datasets complexity with higher accuracy and reliability. This research highlights the importance of advanced ML techniques in predictive analytics, offering a significant improvement over traditional methods and other contemporary models.

arxiv情報

著者 Priyam Ganguly,Isha Mukherjee
発行日 2024-10-17 17:11:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク