A Memetic Algorithm with Reinforcement Learning for Sociotechnical Production Scheduling


次の学際的な記事では、実用指向の二重リソース制約付き柔軟なジョブ ショップ スケジューリング問題 (DRC-FJSSP) を解決するための深層強化学習 (DRL) を適用したミーム アルゴリズムを紹介します。
業界の研究プロジェクトから、柔軟な機械、柔軟な人材、作業者の能力、セットアップと処理作業、材料の到着時間、部品表 (BOM) 製造のための並行タスクを含む複雑なジョブ パス、順序依存のセットアップを考慮する必要があることを認識しています。
近年、メタヒューリスティックと DRL 技術に関する広範な研究が行われていますが、その焦点は単純なスケジューリング環境にあります。
ただし、メタヒューリスティックと DRL を組み合わせて、より確実かつ効率的にスケジュールを生成するアプローチはほとんどありません。
このペーパーでは、まず DRC-FJSSP を定式化して、従来のジョブショップ モデルを超えた複雑な業界要件をマッピングします。
次に、並列コンピューティングと多基準最適化を考慮して、スケジュール評価のために離散イベント シミュレーション (DES) を統合したスケジューリング フレームワークを提案します。
ここでは、ミーム アルゴリズムが DRL で強化され、順序付けと割り当ての決定が改善されます。
実際の生産データを使用した数値実験を通じて、フレームワークが効率的かつ確実に実現可能なスケジュールを生成し、メイクスパン (MS) と総遅刻 (TT) のバランスの取れた最適化を実現することを確認しました。
ランダムなメタヒューリスティック操作の代わりに DRL を利用すると、少ないアルゴリズムの反復でより良い結果が得られ、このような複雑な環境では従来のアプローチよりも優れたパフォーマンスを発揮します。


The following interdisciplinary article presents a memetic algorithm with applying deep reinforcement learning (DRL) for solving practically oriented dual resource constrained flexible job shop scheduling problems (DRC-FJSSP). From research projects in industry, we recognize the need to consider flexible machines, flexible human workers, worker capabilities, setup and processing operations, material arrival times, complex job paths with parallel tasks for bill of material (BOM) manufacturing, sequence-dependent setup times and (partially) automated tasks in human-machine-collaboration. In recent years, there has been extensive research on metaheuristics and DRL techniques but focused on simple scheduling environments. However, there are few approaches combining metaheuristics and DRL to generate schedules more reliably and efficiently. In this paper, we first formulate a DRC-FJSSP to map complex industry requirements beyond traditional job shop models. Then we propose a scheduling framework integrating a discrete event simulation (DES) for schedule evaluation, considering parallel computing and multicriteria optimization. Here, a memetic algorithm is enriched with DRL to improve sequencing and assignment decisions. Through numerical experiments with real-world production data, we confirm that the framework generates feasible schedules efficiently and reliably for a balanced optimization of makespan (MS) and total tardiness (TT). Utilizing DRL instead of random metaheuristic operations leads to better results in fewer algorithm iterations and outperforms traditional approaches in such complex environments.


著者 Felix Grumbach,Nour Eldin Alaa Badr,Pascal Reusch,Sebastian Trojahn
発行日 2023-07-07 07:19:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク