Can Feature Engineering Help Quantum Machine Learning for Malware Detection?

要約

タイトル:フィーチャーエンジニアリングは、マルウェア検出のための量子機械学習に役立つか?

要約:マルウェア攻撃がますます増えて複雑化する中、機械学習(ML)に基づくマルウェア検出システムが重要性を増しています。しかし、マルウェア分類に用いられる多くの人気のあるMLモデルは、教師ありの解決策に基づいています。これらの教師あり分類器は、新しいマルウェアを検出するために頻繁に再トレーニングする必要があるため、汎化性能が低いことがあります。そのため、時間がかかります。この研究は、理論的な量子MLと、データサイズを減らし、マルウェア分類器のトレーニング時間を減らすためのフィーチャ選択戦略のハイブリッドフレームワークでこの問題に対処しました。予備実験結果は、VQC(回路バリアント量子古典ハイブリッド)とXGBoostを用いた特徴選択によって、シミュレータ上で78.91%のテスト精度を達成できたことを示しています。XGBoostで選択された特徴量を使用してトレーニングされたモデルの平均精度は、IBM 5キュービットマシンでは74%(+- 11.35%)でした。

– マルウェア攻撃が増え、機械学習に基づくマルウェア検出システムが重要性を増している。
– 多くの教師あり分類器は汎化性能が低く、新しいマルウェアを検出するために頻繁に再トレーニングする必要がある。
– この研究は、理論的な量子MLとフィーチャ選択戦略を組み合わせたハイブリッドフレームワークでこの問題に対処することを試みた。
– 予備実験では、VQCとXGBoostを用いた特徴選択により、シミュレータ上で78.91%のテスト精度を達成できた。
– IBM 5キュービットマシンでは、XGBoostで選択された特徴量を使用してトレーニングされたモデルの平均精度は74%(+- 11.35%)でした。

要約(オリジナル)

With the increasing number and sophistication of malware attacks, malware detection systems based on machine learning (ML) grow in importance. At the same time, many popular ML models used in malware classification are supervised solutions. These supervised classifiers often do not generalize well to novel malware. Therefore, they need to be re-trained frequently to detect new malware specimens, which can be time-consuming. Our work addresses this problem in a hybrid framework of theoretical Quantum ML, combined with feature selection strategies to reduce the data size and malware classifier training time. The preliminary results show that VQC with XGBoost selected features can get a 78.91% test accuracy on the simulator. The average accuracy for the model trained using the features selected with XGBoost was 74% (+- 11.35%) on the IBM 5 qubits machines.

arxiv情報

著者 Ran Liu,Maksim Eren,Charles Nicholas
発行日 2023-05-03 19:33:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.CR, cs.LG, quant-ph パーマリンク