Harnessing Generative Pre-Trained Transformer for Datacenter Packet Trace Generation

要約

現在、データセンターに依存するアプリケーションの急速な成長により、増大するトラフィックと計算需要に対応するための新たな進歩が求められています。
データセンターからのトラフィック トレースは、将来のデータセンターのさらなる開発と最適化に不可欠です。
しかし、その痕跡が一般に公開されることはほとんどありません。
研究者は多くの場合、複雑なトラフィック パターンを再現するのに必要な深さが欠けている単純化された数学モデルを使用するため、現実的なトラフィックに見られる最適化の機会を逃してしまいます。
この予備作業では、多くの最先端の大規模言語モデルで使用されている生成事前トレーニング済みトランスフォーマー (GPT) アーキテクチャに基づく、パケット レベルのデータセンター トラフィック ジェネレーター (DTG) である DTG-GPT を紹介します。
私たちは、さまざまなドメインからの利用可能なトラフィック トレースの小さなセットでモデルをトレーニングし、生成されたトレースの元の対応物に対する忠実度を評価するためのシンプルな方法論を提供します。
我々は、DTG-GPT が実際のトラフィック トレースに見られる時空間パターンを模倣する新しいトレースを合成できることを示します。
さらに、DTG-GPT が忠実度を維持しながら、さまざまな規模のネットワークのトレースを生成できることを実証します。
私たちの調査結果は、将来的には、DTG-GPT と同様のモデルにより、データセンター運営者が訓練された GPT モデルを介して交通情報を研究コミュニティに公開できるようになる可能性を示しています。

要約(オリジナル)

Today, the rapid growth of applications reliant on datacenters calls for new advancements to meet the increasing traffic and computational demands. Traffic traces from datacenters are essential for further development and optimization of future datacenters. However, traces are rarely released to the public. Researchers often use simplified mathematical models that lack the depth needed to recreate intricate traffic patterns and, thus, miss optimization opportunities found in realistic traffic. In this preliminary work, we introduce DTG-GPT, a packet-level Datacenter Traffic Generator (DTG), based on the generative pre-trained transformer (GPT) architecture used by many state-of-the-art large language models. We train our model on a small set of available traffic traces from different domains and offer a simple methodology to evaluate the fidelity of the generated traces to their original counterparts. We show that DTG-GPT can synthesize novel traces that mimic the spatiotemporal patterns found in real traffic traces. We further demonstrate that DTG-GPT can generate traces for networks of different scales while maintaining fidelity. Our findings indicate the potential that, in the future, similar models to DTG-GPT will allow datacenter operators to release traffic information to the research community via trained GPT models.

arxiv情報

著者 Chen Griner
発行日 2025-01-21 10:55:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: C.2.1, cs.AI, cs.NI パーマリンク