Traffic Engineering in Large-scale Networks with Generalizable Graph Neural Networks

要約

大規模なコンピューターネットワークのトラフィックエンジニアリング(TE)は、グローバルスケールクラウドワイドエリアネットワークの迅速な成長またはバックボーンの低地球軌道衛星星座の迅速な成長により、根本的でありながら挑戦的な問題となっています。
従来のTEアルゴリズムのスケーラビリティの問題に対処するために、学習ベースのアプローチが提案されており、最先端の方法よりも効率的な大幅な改善の可能性を示しています。
それにもかかわらず、既存の学習ベースの方法の本質的な制限は、実用的なアプリケーションを妨害します。それらは、多様なトポロジやネットワーク条件にわたって一般化できず、オーバーヘッドの過剰なトレーニングを受け、デフォルトでリンク容量を尊重しません。
このペーパーでは、大規模なネットワークで問題を効率的に解決しながら、多様なネットワーク条件全体で優れた一般化可能性を達成することを学ぶ新しいTEアルゴリズムであるTelgenを提案します。
Telgenは、「最適なTEソリューションを予測する」という問題を「最適なTEアルゴリズムの予測」に変換するという斬新なアイデアに基づいています。これにより、Telgenは古典的な最適なTEアルゴリズムのエンドツーエンドの解決プロセスを学習し、効率的に近似できます。
学習されたアルゴリズムは、正確なネットワークトポロジまたはトラフィックパターンに不可知論されており、任意の入力を考慮して問題を効率的に解決し、目に見えないトポロジと要求に合わせて適切に一般化できます。
最大5000のノードと106のリンクを備えたランダムおよび実際のネットワークでTelgenをトレーニングおよび評価しました。
Telgenは、テストネットワークがトレーニングで最大のノードよりも最大20倍多くのノードを持っていた場合でも、すべての場合に実現可能性を確保しながら、最適性のギャップが3%未満に達しました。
また、古典的な最適ソルバーよりも最大84%の解決時間を節約し、エポックあたりのトレーニング時間を短縮し、最大のネットワーク上の最新の学習アルゴリズムよりも2〜4桁の時間を短縮することができました。

要約(オリジナル)

Traffic engineering (TE) in large-scale computer networks has become a fundamental yet challenging problem, owing to the swift growth of global-scale cloud wide-area networks or backbone low-Earth-orbit satellite constellations. To address the scalability issue of traditional TE algorithms, learning-based approaches have been proposed, showing potential of significant efficiency improvement over state-of-the-art methods. Nevertheless, the intrinsic limitations of existing learning-based methods hinder their practical application: they are not generalizable across diverse topologies and network conditions, incur excessive training overhead, and do not respect link capacities by default. This paper proposes TELGEN, a novel TE algorithm that learns to solve TE problems efficiently in large-scale networks, while achieving superior generalizability across diverse network conditions. TELGEN is based on the novel idea of transforming the problem of ‘predicting the optimal TE solution’ into ‘predicting the optimal TE algorithm’, which enables TELGEN to learn and efficiently approximate the end-to-end solving process of classical optimal TE algorithms. The learned algorithm is agnostic to the exact network topology or traffic patterns, and can efficiently solve TE problems given arbitrary inputs and generalize well to unseen topologies and demands. We trained and evaluated TELGEN on random and real-world networks with up to 5000 nodes and 106 links. TELGEN achieved less than 3% optimality gap while ensuring feasibility in all cases, even when the test network had up to 20x more nodes than the largest in training. It also saved up to 84% solving time than classical optimal solver, and could reduce training time per epoch and solving time by 2-4 orders of magnitude than latest learning algorithms on the largest networks.

arxiv情報

著者 Fangtong Zhou,Xiaorui Liu,Ruozhou Yu,Guoliang Xue
発行日 2025-03-31 15:21:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.NI パーマリンク