Flexible Job Shop Scheduling via Dual Attention Network Based Reinforcement Learning

要約

タイトル:デュアルアテンションネットワークベースの強化学習による柔軟なジョブショップスケジューリング

要約:
– 柔軟製造によって、複数の機械で操作を行う場合のように、ジョブショップスケジューリング問題(FJSP)のような複雑なスケジューリング問題が生じています。
– FJSPでは、操作と機械の間に入り組んだ関係があります。
– 近年、深層強化学習(DRL)を使用して、優先度ディスパッチングルール(PDR)を学習することで、FJSPの解決に取り組んできました。
– しかし、OR-Toolsのような正確な方法と比較して、解決策の品質はまだ改善の余地があります。
– この問題に対処するために、本論文では、ディープフィーチャーエクストラクションの自己アテンションモデルと、スケーラブルな意思決定のためのDRLの長所を結合する新しいエンドツーエンドの学習フレームワークを提案します。
– 操作と機械の間の複雑な関係を正確かつ簡潔に表現するために、複数の相互接続された操作メッセージアテンションブロックと機械メッセージアテンションブロックからなるデュアルアテンションネットワーク(DAN)が提案されました。
– DANは、複雑な関係を利用して、生産に適応した操作と機械の特徴を構築し、高品質の意思決定を支援します。
– 合成データおよび公共ベンチマークを使用した実験結果は、提案手法が従来のPDRおよび最先端のDRL手法を上回ることを確認しています。さらに、ある場合では正確な方法と比較可能な結果を達成し、大規模で実世界未知のFJSPタスクに対する優れた一般化能力を示しました。

要約(オリジナル)

Flexible manufacturing has given rise to complex scheduling problems such as the flexible job shop scheduling problem (FJSP). In FJSP, operations can be processed on multiple machines, leading to intricate relationships between operations and machines. Recent works have employed deep reinforcement learning (DRL) to learn priority dispatching rules (PDRs) for solving FJSP. However, the quality of solutions still has room for improvement relative to that by the exact methods such as OR-Tools. To address this issue, this paper presents a novel end-to-end learning framework that weds the merits of self-attention models for deep feature extraction and DRL for scalable decision-making. The complex relationships between operations and machines are represented precisely and concisely, for which a dual-attention network (DAN) comprising several interconnected operation message attention blocks and machine message attention blocks is proposed. The DAN exploits the complicated relationships to construct production-adaptive operation and machine features to support high-quality decisionmaking. Experimental results using synthetic data as well as public benchmarks corroborate that the proposed approach outperforms both traditional PDRs and the state-of-the-art DRL method. Moreover, it achieves results comparable to exact methods in certain cases and demonstrates favorable generalization ability to large-scale and real-world unseen FJSP tasks.

arxiv情報

著者 Runqing Wang,Gang Wang,Jian Sun,Fang Deng,Jie Chen
発行日 2023-05-09 01:35:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.LG パーマリンク