Genetic Programming with Reinforcement Learning Trained Transformer for Real-World Dynamic Scheduling Problems

要約

現実世界の環境での動的なスケジューリングは、予期せぬ混乱に適応するのに苦労しており、従来の静的スケジューリング方法と人間が設計したヒューリスティックを不十分にします。
このペーパーでは、動的なスケジューリングシナリオの複雑さに取り組むように特別に設計された、強化学習(GPRT)を通じて訓練された変圧器を組み合わせた革新的なアプローチを紹介します。
GPRTは変圧器を活用してGPによって生成されたヒューリスティックを改良しながら、GPの進化を播種および導きます。
この二重の機能は、スケジューリングヒューリスティックの適応性と有効性を高め、実際のタスクの動的な性質によりよく応答できるようにします。
この統合アプローチの有効性は、GPRTメソッドが従来のGP、スタンドアロントランスメソッド、およびその他の最先端の競合他社よりも優れているコンテナターミナルトラックスケジューリングの実用的なアプリケーションを通じて実証されています。
この研究の重要な貢献は、GPRTメソッドの開発です。これは、GPと強化学習(RL)の新しい組み合わせを示し、堅牢で効率的なスケジューリングソリューションを生成します。
重要なことに、GPRTはコンテナポートトラックのスケジューリングに限定されません。
さまざまな動的スケジューリングの課題に適用される多用途のフレームワークを提供します。
その実用性は、その解釈可能性と修正の容易さと相まって、多様な現実世界のシナリオにとって貴重なツールになります。

要約(オリジナル)

Dynamic scheduling in real-world environments often struggles to adapt to unforeseen disruptions, making traditional static scheduling methods and human-designed heuristics inadequate. This paper introduces an innovative approach that combines Genetic Programming (GP) with a Transformer trained through Reinforcement Learning (GPRT), specifically designed to tackle the complexities of dynamic scheduling scenarios. GPRT leverages the Transformer to refine heuristics generated by GP while also seeding and guiding the evolution of GP. This dual functionality enhances the adaptability and effectiveness of the scheduling heuristics, enabling them to better respond to the dynamic nature of real-world tasks. The efficacy of this integrated approach is demonstrated through a practical application in container terminal truck scheduling, where the GPRT method outperforms traditional GP, standalone Transformer methods, and other state-of-the-art competitors. The key contribution of this research is the development of the GPRT method, which showcases a novel combination of GP and Reinforcement Learning (RL) to produce robust and efficient scheduling solutions. Importantly, GPRT is not limited to container port truck scheduling; it offers a versatile framework applicable to various dynamic scheduling challenges. Its practicality, coupled with its interpretability and ease of modification, makes it a valuable tool for diverse real-world scenarios.

arxiv情報

著者 Xian Chen,Rong Qu,Jing Dong,Ruibin Bai,Yaochu Jin
発行日 2025-04-10 14:18:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI パーマリンク