MORPH: Towards Automated Concept Drift Adaptation for Malware Detection

要約

トレーニングされた機械学習モデルのパフォーマンスは時間の経過とともに低下し、実用的でなくなるため、コンセプトのドリフトはマルウェア検出にとって大きな課題です。
マルウェアの概念ドリフト適応に関するこれまでの研究は、モデルを更新するために代表的なサンプルを選択することを含むアクティブ ラーニングに主に焦点を当てていましたが、自己トレーニングが概念ドリフトを軽減する有望なアプローチとして浮上しています。
自己トレーニングには、擬似ラベルを使用してモデルを再トレーニングし、データ分布の変化に適応することが含まれます。
この研究では、ニューラル ネットワーク向けに特別に設計された効果的な擬似ラベルベースの概念ドリフト適応手法である MORPH を提案します。
Android および Windows マルウェア データセットの広範な実験分析を通じて、コンセプト ドリフトの影響を軽減するアプローチの有効性を実証します。
私たちの方法には、アクティブ ラーニングと組み合わせると、アノテーションの労力が軽減されるという利点があります。
さらに、私たちの方法は、マルウェア検出のための自動化されたコンセプトドリフト適応において、既存の研究よりも大幅に改善されています。

要約(オリジナル)

Concept drift is a significant challenge for malware detection, as the performance of trained machine learning models degrades over time, rendering them impractical. While prior research in malware concept drift adaptation has primarily focused on active learning, which involves selecting representative samples to update the model, self-training has emerged as a promising approach to mitigate concept drift. Self-training involves retraining the model using pseudo labels to adapt to shifting data distributions. In this research, we propose MORPH — an effective pseudo-label-based concept drift adaptation method specifically designed for neural networks. Through extensive experimental analysis of Android and Windows malware datasets, we demonstrate the efficacy of our approach in mitigating the impact of concept drift. Our method offers the advantage of reducing annotation efforts when combined with active learning. Furthermore, our method significantly improves over existing works in automated concept drift adaptation for malware detection.

arxiv情報

著者 Md Tanvirul Alam,Romy Fieblinger,Ashim Mahara,Nidhi Rastogi
発行日 2024-01-23 14:25:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク