Accelerating Vehicle Routing via AI-Initialized Genetic Algorithms

要約

車両ルーティングの問題(VRP)は、旅行営業担当者の問題の延長であり、組み合わせの最適化における基本的なNPハードの課題です。
大規模にリアルタイムでVRPを解くことは、ラストマイル配信などの成長市場からインタラクティブロジスティクス計画などの新興使用ケースまで、多数のアプリケーションで重要になっています。
このようなアプリケーションには、同様の問題インスタンスを繰り返し解決しますが、現在の最新のソルバーは、以前の例を活用することなく、各インスタンスを独自に扱います。
以前のインスタンスで訓練された強化学習エージェントを使用して、初期ソリューションを迅速に生成する新しい最適化フレームワークを導入し、遺伝的アルゴリズムによってさらに最適化されます。
私たちのフレームワーク、補強学習初期化(EARLI)を備えた進化的アルゴリズムは、さまざまな時間スケールで現在の最先端のソルバーよりも一貫して優れています。
たとえば、Earliは、同じソリューション品質のために、現在のソルバーより10倍高速な500か所の車両ルーティングを処理し、リアルタイムやインタラクティブルーティングなどのアプリケーションを有効にします。
Earliは、以前に見えなかった都市の実際のeコマース配信データで実証されているように、新しいデータに一般化できます。
当社のハイブリッドフレームワークは、強化学習と遺伝的アルゴリズムを組み合わせた新しい方法を提示し、AIと最適化コミュニティの間の学際的なコラボレーションのために道を開き、多様なドメインのリアルタイムの最適化に向けています。

要約(オリジナル)

Vehicle Routing Problems (VRP) are an extension of the Traveling Salesperson Problem and are a fundamental NP-hard challenge in combinatorial optimization. Solving VRP in real-time at large scale has become critical in numerous applications, from growing markets like last-mile delivery to emerging use-cases like interactive logistics planning. Such applications involve solving similar problem instances repeatedly, yet current state-of-the-art solvers treat each instance on its own without leveraging previous examples. We introduce a novel optimization framework that uses a reinforcement learning agent – trained on prior instances – to quickly generate initial solutions, which are then further optimized by genetic algorithms. Our framework, Evolutionary Algorithm with Reinforcement Learning Initialization (EARLI), consistently outperforms current state-of-the-art solvers across various time scales. For example, EARLI handles vehicle routing with 500 locations within 1s, 10x faster than current solvers for the same solution quality, enabling applications like real-time and interactive routing. EARLI can generalize to new data, as demonstrated on real e-commerce delivery data of a previously unseen city. Our hybrid framework presents a new way to combine reinforcement learning and genetic algorithms, paving the road for closer interdisciplinary collaboration between AI and optimization communities towards real-time optimization in diverse domains.

arxiv情報

著者 Ido Greenberg,Piotr Sielski,Hugo Linsenmaier,Rajesh Gandham,Shie Mannor,Alex Fender,Gal Chechik,Eli Meirom
発行日 2025-04-08 15:21:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.NE パーマリンク