A Survey on Malware Detection with Graph Representation Learning

要約

マルウェアの数と複雑さが増しているため、マルウェアの検出は大きな懸念事項となっています。
シグネチャとヒューリスティックに基づく従来の検出方法は、マルウェアの検出に使用されますが、残念ながら、未知の攻撃に対する一般化が不十分であり、難読化技術を使用して簡単に回避できます。
近年、機械学習 (ML) と特にディープ ラーニング (DL) は、データから有用な表現を学習することにより、マルウェア検出で目覚ましい結果を達成し、従来の方法よりも優先されるソリューションになりました。
最近では、グラフ構造のデータにこのような手法を適用することで、さまざまな分野で最先端のパフォーマンスが達成され、マルウェアからより堅牢な表現を学習するという有望な結果が示されています。
しかし、マルウェア検出のためのグラフベースの深層学習に焦点を当てた文献レビューは存在しません。
この調査では、共通のアプローチとアーキテクチャの下で既存の作業を要約および統合するための詳細な文献レビューを提供します。
グラフ ニューラル ネットワーク (GNN) が、表現力豊かなグラフ構造として表されるマルウェアからの堅牢な埋め込みの学習において競争力のある結果に達し、下流の分類子による効率的な検出につながることを特に実証します。
このホワイトペーパーでは、グラフベースの検出方法を欺くために利用される敵対的攻撃についてもレビューします。
課題と将来の研究の方向性については、論文の最後で説明しています。

要約(オリジナル)

Malware detection has become a major concern due to the increasing number and complexity of malware. Traditional detection methods based on signatures and heuristics are used for malware detection, but unfortunately, they suffer from poor generalization to unknown attacks and can be easily circumvented using obfuscation techniques. In recent years, Machine Learning (ML) and notably Deep Learning (DL) achieved impressive results in malware detection by learning useful representations from data and have become a solution preferred over traditional methods. More recently, the application of such techniques on graph-structured data has achieved state-of-the-art performance in various domains and demonstrates promising results in learning more robust representations from malware. Yet, no literature review focusing on graph-based deep learning for malware detection exists. In this survey, we provide an in-depth literature review to summarize and unify existing works under the common approaches and architectures. We notably demonstrate that Graph Neural Networks (GNNs) reach competitive results in learning robust embeddings from malware represented as expressive graph structures, leading to an efficient detection by downstream classifiers. This paper also reviews adversarial attacks that are utilized to fool graph-based detection methods. Challenges and future research directions are discussed at the end of the paper.

arxiv情報

著者 Tristan Bilot,Nour El Madhoun,Khaldoun Al Agha,Anis Zouaoui
発行日 2023-03-28 14:27:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CR, cs.LG パーマリンク