要約
ロボット移動型フルフィルメントシステム(RMFS)におけるポッド再配置問題(PRP)は、ピッキングステーションから戻ってきたポッドの最適な保管場所を選択する問題である。本研究では、適応的大規模近傍探索(ALNS)と深層強化学習(DRL)を統合した改善された解法を提示する。DRLエージェントは動的に破壊オペレータと修復オペレータを選択し、探索中に破壊度や受け入れ閾値などの主要パラメータを調整する。ポッドの使用頻度や移動コストなど、PRP特有の特性を反映するために、両オペレータに特化したヒューリスティックを設計している。計算の結果、このDRLガイド付きALNSは、最安値探索、固定値探索、二項整数計画法、静的ヒューリスティックスといった従来のアプローチを凌駕することが示された。本手法は強力な解の質を示し、倉庫システムの組合せ最適化における学習主導型制御の利点を示している。
要約(オリジナル)
The Pod Repositioning Problem (PRP) in Robotic Mobile Fulfillment Systems (RMFS) involves selecting optimal storage locations for pods returning from pick stations. This work presents an improved solution method that integrates Adaptive Large Neighborhood Search (ALNS) with Deep Reinforcement Learning (DRL). A DRL agent dynamically selects destroy and repair operators and adjusts key parameters such as destruction degree and acceptance thresholds during the search. Specialized heuristics for both operators are designed to reflect PRP-specific characteristics, including pod usage frequency and movement costs. Computational results show that this DRL-guided ALNS outperforms traditional approaches such as cheapest-place, fixed-place, binary integer programming, and static heuristics. The method demonstrates strong solution quality and illustrating the benefit of learning-driven control within combinatorial optimization for warehouse systems.
arxiv情報
著者 | Lin Xie,Hanyi Li |
発行日 | 2025-06-03 11:07:41+00:00 |
arxivサイト | arxiv_id(pdf) |