CESNET-TimeSeries24: Time Series Dataset for Network Traffic Anomaly Detection and Forecasting

要約

ネットワーク トラフィックの異常検出は、コンピュータ ネットワークのセキュリティを維持し、悪意のあるアクティビティを特定するために重要です。
異常検出の主なアプローチの 1 つは、予測に基づく方法です。
それにもかかわらず、予測および異常検出技術のための広範な現実世界のネットワーク データセットが不足しているため、異常検出アルゴリズムのパフォーマンスが過大評価される可能性があります。
この原稿は、CESNET3 ネットワークから収集されたネットワーク エンティティの動作の時系列データで構成されるデータセットを導入することで、このギャップに対処します。
このデータセットは、27 万 5,000 のアクティブな IP アドレスの 40 週間のネットワーク トラフィックから作成されました。
提示されたデータの発信元が ISP であるため、ネットワーク エンティティ間の高レベルの変動が保証され、これが予測および異常検出モデルに固有の本格的な課題を形成します。
これは、予測ベースの異常検出アプローチの実際の展開に関する貴重な洞察を提供します。

要約(オリジナル)

Anomaly detection in network traffic is crucial for maintaining the security of computer networks and identifying malicious activities. One of the primary approaches to anomaly detection are methods based on forecasting. Nevertheless, extensive real-world network datasets for forecasting and anomaly detection techniques are missing, potentially causing performance overestimation of anomaly detection algorithms. This manuscript addresses this gap by introducing a dataset comprising time series data of network entities’ behavior, collected from the CESNET3 network. The dataset was created from 40 weeks of network traffic of 275 thousand active IP addresses. The ISP origin of the presented data ensures a high level of variability among network entities, which forms a unique and authentic challenge for forecasting and anomaly detection models. It provides valuable insights into the practical deployment of forecast-based anomaly detection approaches.

arxiv情報

著者 Josef Koumar,Karel Hynek,Tomáš Čejka,Pavel Šiška
発行日 2024-09-27 16:10:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク