Enhancing Encrypted Internet Traffic Classification Through Advanced Data Augmentation Techniques


オンライン サービスの人気の高まりにより、インターネット トラフィック分類が重要な研究分野になりました。
ただし、インターネット プロトコルと暗号化の急速な発展により、使用可能なデータの可用性が制限されています。
このペーパーでは、オープンソース データセットの不足と既存のデータセットの制限に焦点を当て、暗号化されたインターネット トラフィックを分類するという課題について取り上げます。
実際のサンプルに基づいてデータを合成的に生成するための 2 つのデータ拡張 (DA) 手法、平均拡張と MTU 拡張を提案します。
どちらの拡張も、それぞれ異なる観点から分類器のパフォーマンスを向上させることを目的としています。平均拡張は、新しい合成サンプルを生成することでデータセット サイズを増やすことを目的としているのに対し、MTU 拡張は、さまざまな最大伝送単位 (MTU) に対する分類器の堅牢性を強化します。
2 つの有名な学術データセットと 1 つの商用データセットに対して行われた私たちの実験は、モデルのパフォーマンスを向上させ、限られた均質なデータセットに関連する制約を軽減する上で、これらのアプローチの有効性を実証しています。
私たちの調査結果は、現代のインターネット トラフィック分類の課題に対処する上でのデータ拡張の可能性を強調しています。
この改善により、トラフィックがビデオ ストリーミング (YouTube など) またはチャット (Google Chat など) としてより正確に分類されるため、ユーザーのエクスペリエンス品質 (QoE) にプラスの影響を与えることができます。
さらに、ファイルのダウンロード アクティビティ (Google ドキュメントなど) のサービス品質 (QoS) を強化できます。


The increasing popularity of online services has made Internet Traffic Classification a critical field of study. However, the rapid development of internet protocols and encryption limits usable data availability. This paper addresses the challenges of classifying encrypted internet traffic, focusing on the scarcity of open-source datasets and limitations of existing ones. We propose two Data Augmentation (DA) techniques to synthetically generate data based on real samples: Average augmentation and MTU augmentation. Both augmentations are aimed to improve the performance of the classifier, each from a different perspective: The Average augmentation aims to increase dataset size by generating new synthetic samples, while the MTU augmentation enhances classifier robustness to varying Maximum Transmission Units (MTUs). Our experiments, conducted on two well-known academic datasets and a commercial dataset, demonstrate the effectiveness of these approaches in improving model performance and mitigating constraints associated with limited and homogeneous datasets. Our findings underscore the potential of data augmentation in addressing the challenges of modern internet traffic classification. Specifically, we show that our augmentation techniques significantly enhance encrypted traffic classification models. This improvement can positively impact user Quality of Experience (QoE) by more accurately classifying traffic as video streaming (e.g., YouTube) or chat (e.g., Google Chat). Additionally, it can enhance Quality of Service (QoS) for file downloading activities (e.g., Google Docs).


著者 Yehonatan Zion,Porat Aharon,Ran Dubin,Amit Dvir,Chen Hajaj
発行日 2024-07-23 14:49:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク