要約
既存のニューラル ヒューリスティックでは、多くの場合、特定の配車経路問題 (VRP) ごとに深いアーキテクチャを最初からトレーニングし、さまざまな VRP バリアント間で転送可能な知識を無視しています。
この論文では、さまざまなダウンストリーム VRP バリアントのヒューリスティック トレーニングを支援するクロス問題学習を提案します。
特に、複雑な VRP のニューラル アーキテクチャを、1) 巡回セールスマン問題 (TSP) に取り組むためのバックボーン Transformer、2) 複雑な VRP の問題固有の機能を処理するための追加の軽量モジュールにモジュール化します。
したがって、TSP のバックボーン Transformer を事前トレーニングし、それをターゲット VRP バリアントごとに Transformer モデルを微調整するプロセスに適用することを提案します。
一方で、トレーニング済みのバックボーン Transformer と問題固有のモジュールを同時に完全に微調整します。
一方、バックボーンのトランスフォーマーは動かさずに、モジュールとともに小さなアダプター ネットワークのみを微調整します。
典型的な VRP での広範な実験により、1) 完全な微調整は、最初からトレーニングした場合よりも大幅に優れたパフォーマンスを達成すること、2) アダプターベースの微調整も、パラメーター効率が顕著でありながら、同等のパフォーマンスを提供することが実証されています。
さらに、本発明者らは、クロスディストリビューション適用および多用途性の観点から、本発明の方法の有利な効果を経験的に実証する。
要約(オリジナル)
Existing neural heuristics often train a deep architecture from scratch for each specific vehicle routing problem (VRP), ignoring the transferable knowledge across different VRP variants. This paper proposes the cross-problem learning to assist heuristics training for different downstream VRP variants. Particularly, we modularize neural architectures for complex VRPs into 1) the backbone Transformer for tackling the travelling salesman problem (TSP), and 2) the additional lightweight modules for processing problem-specific features in complex VRPs. Accordingly, we propose to pre-train the backbone Transformer for TSP, and then apply it in the process of fine-tuning the Transformer models for each target VRP variant. On the one hand, we fully fine-tune the trained backbone Transformer and problem-specific modules simultaneously. On the other hand, we only fine-tune small adapter networks along with the modules, keeping the backbone Transformer still. Extensive experiments on typical VRPs substantiate that 1) the full fine-tuning achieves significantly better performance than the one trained from scratch, and 2) the adapter-based fine-tuning also delivers comparable performance while being notably parameter-efficient. Furthermore, we empirically demonstrate the favorable effect of our method in terms of cross-distribution application and versatility.
arxiv情報
著者 | Zhuoyi Lin,Yaoxin Wu,Bangjian Zhou,Zhiguang Cao,Wen Song,Yingqian Zhang,Senthilnath Jayavelu |
発行日 | 2024-05-14 11:59:55+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google