A Late Multi-Modal Fusion Model for Detecting Hybrid Spam E-mail

要約

近年、スパマーは、画像とテキストの両方の部分を組み合わせたハイブリッドスパム電子メールを導入することで、意図を曖昧にしようとしています。これは、テキストまたは画像のみを含む電子メールと比較して、検出がより困難です。
この研究の背後にある動機は、従来のテキストベースまたは画像ベースのみのフィルターがハイブリッド スパム電子メールを検出できない状況を回避するために、ハイブリッド スパム電子メールをフィルター処理する効果的なアプローチを設計することです。
私たちの知る限りでは、ハイブリッド スパム電子メールの検出を目的として、いくつかの調査が実施されています。
通常、光学式文字認識 (OCR) 技術を使用して、画像をテキストに変換することでスパムの画像部分を除去します。
ただし、研究課題は、OCR スキャンはテキストと画像のハイブリッド スパムの処理において非常に成功した手法であるものの、必要な CPU パワーとスキャンにかかる実行時間のために、大量の処理には効果的なソリューションではないということです。
電子メール ファイル。
また、OCR 技術は、変換プロセスにおいて常に信頼できるとは限りません。
このような問題に対処するために、OCR メソッドに基づく古典的な早期融合検出フレームワークと比較して、テキストと画像のハイブリッド スパム電子メール フィルタリング システム用の新しい後期マルチモーダル フュージョン トレーニング フレームワークを提案します。
Convolutional Neural Network (CNN) と Continuous Bag of Words を実装して、ハイブリッド スパムの画像部分とテキスト部分からそれぞれ特徴を抽出しました。生成された特徴は、シグモイド レイヤーと機械学習ベースの分類器 (ランダム フォレスト (RF)、デシジョン ツリー (DT) など) に供給されました。
)、ナイーブ ベイズ (NB)、およびサポート ベクター マシン (SVM) を使用して、電子メールのハムまたはスパムを判断します。

要約(オリジナル)

In recent years, spammers are now trying to obfuscate their intents by introducing hybrid spam e-mail combining both image and text parts, which is more challenging to detect in comparison to e-mails containing text or image only. The motivation behind this research is to design an effective approach filtering out hybrid spam e-mails to avoid situations where traditional text-based or image-baesd only filters fail to detect hybrid spam e-mails. To the best of our knowledge, a few studies have been conducted with the goal of detecting hybrid spam e-mails. Ordinarily, Optical Character Recognition (OCR) technology is used to eliminate the image parts of spam by transforming images into text. However, the research questions are that although OCR scanning is a very successful technique in processing text-and-image hybrid spam, it is not an effective solution for dealing with huge quantities due to the CPU power required and the execution time it takes to scan e-mail files. And the OCR techniques are not always reliable in the transformation processes. To address such problems, we propose new late multi-modal fusion training frameworks for a text-and-image hybrid spam e-mail filtering system compared to the classical early fusion detection frameworks based on the OCR method. Convolutional Neural Network (CNN) and Continuous Bag of Words were implemented to extract features from image and text parts of hybrid spam respectively, whereas generated features were fed to sigmoid layer and Machine Learning based classifiers including Random Forest (RF), Decision Tree (DT), Naive Bayes (NB) and Support Vector Machine (SVM) to determine the e-mail ham or spam.

arxiv情報

著者 Zhibo Zhang,Ernesto Damiani,Hussam Al Hamadi,Chan Yeob Yeun,Fatma Taher
発行日 2023-03-13 13:06:18+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CR パーマリンク