要約
組み合わせ最適化問題に機械学習を適用すると、効率と精度の両方が向上する可能性があります。
ただし、既存の学習ベースのソルバーは、問題の分布と規模の変化に直面したときに、一般化に苦労することがよくあります。
このホワイト ペーパーでは、ASP: Adaptive Staircase Policy Space Response Oracle と呼ばれる新しいアプローチを提案して、これらの一般化の問題に対処し、ユニバーサル ニューラル ソルバーを学習します。
ASP は 2 つのコンポーネントで構成されています。それは、ポリシー スペース レスポンス オラクルを使用して未知の分布を処理するソルバーの能力を強化する分布探索と、カリキュラム学習を通じてスケーラビリティを向上させる持続的スケール適応です。
私たちは、巡回セールスマン問題、配車ルートの問題、TSP の賞品収集、TSPLib と CVRPLib の実世界のインスタンスなど、いくつかの困難な COP で ASP をテストしました。
私たちの結果は、モデル サイズが同じでトレーニング信号が弱い場合でも、ASP はニューラル ソルバーが目に見えない分布やさまざまなスケールを探索して適応し、優れたパフォーマンスを達成するのに役立つことを示しています。
特に、標準的なトレーニング パイプラインの下で同じニューラル ソルバーと比較すると、ASP は、生成されたインスタンスと TSP の実際のインスタンスで 90.9% と 47.43% の最適性のギャップの点で著しく減少し、19% の減少と
CVRP では 45.57%。
要約(オリジナル)
Applying machine learning to combinatorial optimization problems has the potential to improve both efficiency and accuracy. However, existing learning-based solvers often struggle with generalization when faced with changes in problem distributions and scales. In this paper, we propose a new approach called ASP: Adaptive Staircase Policy Space Response Oracle to address these generalization issues and learn a universal neural solver. ASP consists of two components: Distributional Exploration, which enhances the solver’s ability to handle unknown distributions using Policy Space Response Oracles, and Persistent Scale Adaption, which improves scalability through curriculum learning. We have tested ASP on several challenging COPs, including the traveling salesman problem, the vehicle routing problem, and the prize collecting TSP, as well as the real-world instances from TSPLib and CVRPLib. Our results show that even with the same model size and weak training signal, ASP can help neural solvers explore and adapt to unseen distributions and varying scales, achieving superior performance. In particular, compared with the same neural solvers under a standard training pipeline, ASP produces a remarkable decrease in terms of the optimality gap with 90.9% and 47.43% on generated instances and real-world instances for TSP, and a decrease of 19% and 45.57% for CVRP.
arxiv情報
著者 | Chenguang Wang,Zhouliang Yu,Stephen McAleer,Tianshu Yu,Yaodong Yang |
発行日 | 2023-03-01 12:47:14+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google