Classifying World War II Era Ciphers with Machine Learning

要約

暗号文のみが利用可能な場合に、機械学習および深層学習技術が選択された第二次世界大戦時代の暗号を分類できる精度を決定します。
考慮される具体的な暗号は、Enigma、M-209、Sigaba、Purple、および Typex です。
私たちは、サポート ベクター マシン (SVM)、$k$-最近傍 ($k$-NN)、およびランダム フォレスト (RF) という 3 つの古典的な機械学習モデルを実験します。
また、多層パーセプトロン (MLP)、長短期記憶 (LSTM)、エクストリーム ラーニング マシン (ELM)、畳み込みニューラル ネットワーク (CNN) の 4 つの深層学習ニューラル ネットワーク ベースのモデルも実験します。
各モデルは、ヒストグラム、ダイグラム、および生の暗号文文字シーケンスで構成される特徴に基づいてトレーニングされます。
さらに、分類問題は、固定キーを使用した固定平文、固定キーを使用したランダム平文、ランダム キーを使用した固定平文、およびランダム キーを使用したランダム平文の 4 つの異なるシナリオの下で検討されます。
最も現実的なシナリオでは、暗号文ごとに 1000 文字が与えられると、97% 以上の精度で暗号を区別できます。
さらに、学習手法のサブセットの精度を暗号文メッセージの長さの関数として考慮します。
少し驚くべきことに、当社の従来の機械学習モデルは、少なくとも深層学習モデルと同等のパフォーマンスを発揮します。
また、設計が類似している暗号ほど区別するのがやや難しいものの、予想されるほど難しくないこともわかりました。

要約(オリジナル)

We determine the accuracy with which machine learning and deep learning techniques can classify selected World War II era ciphers when only ciphertext is available. The specific ciphers considered are Enigma, M-209, Sigaba, Purple, and Typex. We experiment with three classic machine learning models, namely, Support Vector Machines (SVM), $k$-Nearest Neighbors ($k$-NN), and Random Forest (RF). We also experiment with four deep learning neural network-based models: Multi-Layer Perceptrons (MLP), Long Short-Term Memory (LSTM), Extreme Learning Machines (ELM), and Convolutional Neural Networks (CNN). Each model is trained on features consisting of histograms, digrams, and raw ciphertext letter sequences. Furthermore, the classification problem is considered under four distinct scenarios: Fixed plaintext with fixed keys, random plaintext with fixed keys, fixed plaintext with random keys, and random plaintext with random keys. Under the most realistic scenario, given 1000 characters per ciphertext, we are able to distinguish the ciphers with greater than 97% accuracy. In addition, we consider the accuracy of a subset of the learning techniques as a function of the length of the ciphertext messages. Somewhat surprisingly, our classic machine learning models perform at least as well as our deep learning models. We also find that ciphers that are more similar in design are somewhat more challenging to distinguish, but not as difficult as might be expected.

arxiv情報

著者 Brooke Dalton,Mark Stamp
発行日 2023-08-30 13:02:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CR, cs.LG パーマリンク