Interpretable Reinforcement Learning via Neural Additive Models for Inventory Management


COVID-19 のパンデミックにより、サプライ チェーンの重要性と、環境の動的な変化に対応するためのデジタル管理の役割が浮き彫りになりました。
したがって、これらのポリシーは、COVID-19 危機の際に見られたような動的な変化に適応することができません。
強化学習エージェントの解釈可能な動的ポリシーとして Neural Additive Models を使用することを提案し、このアプローチが標準の完全に接続されたポリシーと競合することを示します。
最後に、解釈可能性のプロパティを使用して、シンプルで直線的な 3 段階の在庫サプライ チェーンの複雑な注文戦略についての洞察を得ることができます。


The COVID-19 pandemic has highlighted the importance of supply chains and the role of digital management to react to dynamic changes in the environment. In this work, we focus on developing dynamic inventory ordering policies for a multi-echelon, i.e. multi-stage, supply chain. Traditional inventory optimization methods aim to determine a static reordering policy. Thus, these policies are not able to adjust to dynamic changes such as those observed during the COVID-19 crisis. On the other hand, conventional strategies offer the advantage of being interpretable, which is a crucial feature for supply chain managers in order to communicate decisions to their stakeholders. To address this limitation, we propose an interpretable reinforcement learning approach that aims to be as interpretable as the traditional static policies while being as flexible and environment-agnostic as other deep learning-based reinforcement learning solutions. We propose to use Neural Additive Models as an interpretable dynamic policy of a reinforcement learning agent, showing that this approach is competitive with a standard full connected policy. Finally, we use the interpretability property to gain insights into a complex ordering strategy for a simple, linear three-echelon inventory supply chain.


著者 Julien Siems,Maximilian Schambach,Sebastian Schulze,Johannes S. Otterbach
発行日 2023-03-22 14:19:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.LG, cs.MA パーマリンク