要約
近年、マルウェア検出に画像ベースの技術を使用することが注目を集めており、実行可能ファイルから派生した画像の分類における畳み込みニューラル ネットワーク (CNN) などの深層学習アプローチの有効性が数多くの研究で実証されています。
この論文では、実行可能ファイルから抽出された特徴を QR および Aztec コードに変換する画像変換プロセスに依存する革新的な方法を検討します。
これらのコードは、CNN の学習能力を強化できる形式で構造パターンをキャプチャします。
私たちは、これらのコードの固有の特性に合わせた CNN アーキテクチャを設計および実装し、それらを 2 つの広範なマルウェア データセットを含む包括的な分析に適用します。どちらのデータセットにも、無害なサンプルの重要なコーパスが含まれています。
私たちの結果は、QR コードとアステカ コードでトレーニングされた CNN が、一方のデータセットでは最先端のパフォーマンスを上回っていましたが、もう一方のデータセットでは、より一般的な技術を下回っているという、判断が分かれています。
これらの結果は、特徴エンジニアリングの形式として QR コードとアステカ コードを使用することがマルウェア ドメインで大きな可能性を秘めていること、およびそのようなアプローチの相対的な長所と短所をよりよく理解するには追加の研究が必要であることを示しています。
要約(オリジナル)
In recent years, the use of image-based techniques for malware detection has gained prominence, with numerous studies demonstrating the efficacy of deep learning approaches such as Convolutional Neural Networks (CNN) in classifying images derived from executable files. In this paper, we consider an innovative method that relies on an image conversion process that consists of transforming features extracted from executable files into QR and Aztec codes. These codes capture structural patterns in a format that may enhance the learning capabilities of CNNs. We design and implement CNN architectures tailored to the unique properties of these codes and apply them to a comprehensive analysis involving two extensive malware datasets, both of which include a significant corpus of benign samples. Our results yield a split decision, with CNNs trained on QR and Aztec codes outperforming the state of the art on one of the datasets, but underperforming more typical techniques on the other dataset. These results indicate that the use of QR and Aztec codes as a form of feature engineering holds considerable promise in the malware domain, and that additional research is needed to better understand the relative strengths and weaknesses of such an approach.
arxiv情報
| 著者 | Atharva Khadilkar,Mark Stamp |
| 発行日 | 2024-12-11 16:25:06+00:00 |
| arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google