要約
補充決定を最適化することによって製品の需要と供給のバランスを維持することは、サプライチェーン業界における最も重要な課題の一つである。本論文では、MARLIMと呼ばれる新しい強化学習フレームワークを提示し、確率的な需要とリードタイムを持つ単一エケロンの多品種サプライチェーンの在庫管理問題に取り組む。MARLIMでは、単一または複数のエージェントによる協調的な制御が行われる。実データを用いた数値実験により、従来のベースラインに対する強化学習手法の利点を実証している。
要約(オリジナル)
Maintaining a balance between the supply and demand of products by optimizing replenishment decisions is one of the most important challenges in the supply chain industry. This paper presents a novel reinforcement learning framework called MARLIM, to address the inventory management problem for a single-echelon multi-products supply chain with stochastic demands and lead-times. Within this context, controllers are developed through single or multiple agents in a cooperative setting. Numerical experiments on real data demonstrate the benefits of reinforcement learning methods over traditional baselines.
arxiv情報
著者 | Rémi Leluc,Elie Kadoche,Antoine Bertoncello,Sébastien Gourvénec |
発行日 | 2023-08-03 09:31:45+00:00 |
arxivサイト | arxiv_id(pdf) |