Interpretable Feature Learning in Multivariate Big Data Analysis for Network Monitoring

要約

通信ネットワークの性能評価に有用な新しいデータ駆動型モデルの開発に対する関心が高まっている。ネットワークの監視やトラブルシューティングのような多くのアプリケーションでは、データモデルが人間のオペレータによって解釈できなければ、ほとんど役に立ちません。本稿では、最近提案された解釈可能なデータ解析ツールである多変量ビッグデータ解析(MBDA)手法の拡張を紹介する。この拡張では、データ量が膨大な場合にMBDAを適用するための基礎となるステップである、特徴の自動導出のソリューションを提案する。その結果、ネットワークモニタリングアプローチは、解釈可能で対話的なモデルの利点と並列処理のパワーを組み合わせたデータ解析ワークフローにより、異種ネットワークの異常を検出・診断することを可能にする。拡張MBDAを2つのケーススタディに適用する:UGR’16は、異常検出のためのベンチマークフローベースの実トラフィックデータセットであり、Dartmouth’18は、現在までに知られている最長かつ最大のWi-Fiトレースである。

要約(オリジナル)

There is an increasing interest in the development of new data-driven models useful to assess the performance of communication networks. For many applications, like network monitoring and troubleshooting, a data model is of little use if it cannot be interpreted by a human operator. In this paper, we present an extension of the Multivariate Big Data Analysis (MBDA) methodology, a recently proposed interpretable data analysis tool. In this extension, we propose a solution to the automatic derivation of features, a cornerstone step for the application of MBDA when the amount of data is massive. The resulting network monitoring approach allows us to detect and diagnose disparate network anomalies, with a data-analysis workflow that combines the advantages of interpretable and interactive models with the power of parallel processing. We apply the extended MBDA to two case studies: UGR’16, a benchmark flow-based real-traffic dataset for anomaly detection, and Dartmouth’18, the longest and largest Wi-Fi trace known to date.

arxiv情報

著者 José Camacho,Katarzyna Wasielewska,Rasmus Bro,David Kotz
発行日 2024-03-01 10:28:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG, cs.NI, stat.ML パーマリンク