Identifying Relevant Features of CSE-CIC-IDS2018 Dataset for the Development of an Intrusion Detection System


侵入検知システム (IDS) は、IT システムの重要な要素です。
その主要なコンポーネントは、ネットワーク トラフィックのいくつかの特徴を継続的に評価し、潜在的な脅威を特定する分類モジュールです。
したがって、IDS の開発過程では、悪意のあるトラフィックと良性のトラフィックを安全に区別するために必要な最小限の機能セットを特定することが不可欠です。
このペーパーでは、5 つの攻撃タイプに焦点を当て、AWS データセット上の CSE-CIC-IDS2018 の場合の前処理と機能選択のワークフローとその結果を示します。
関連する特徴を特定するために、6 つの特徴選択方法が適用され、平均スコアに基づいて特徴の最終的なランキングが精緻化されました。
次に、さまざまなランキングしきい値に基づいて特徴のいくつかのサブセットが形成され、各サブセットを 5 つの分類アルゴリズムで試行して、各攻撃タイプに最適な特徴セットを決定しました。
評価では、広く使用されている 4 つの指標が考慮されました。


Intrusion detection systems (IDSs) are essential elements of IT systems. Their key component is a classification module that continuously evaluates some features of the network traffic and identifies possible threats. Its efficiency is greatly affected by the right selection of the features to be monitored. Therefore, the identification of a minimal set of features that are necessary to safely distinguish malicious traffic from benign traffic is indispensable in the course of the development of an IDS. This paper presents the preprocessing and feature selection workflow as well as its results in the case of the CSE-CIC-IDS2018 on AWS dataset, focusing on five attack types. To identify the relevant features, six feature selection methods were applied, and the final ranking of the features was elaborated based on their average score. Next, several subsets of the features were formed based on different ranking threshold values, and each subset was tried with five classification algorithms to determine the optimal feature set for each attack type. During the evaluation, four widely used metrics were taken into consideration.


著者 László Göcs,Zsolt Csaba Johanyák
発行日 2023-07-21 12:45:03+00:00
