Machine Learning Techniques for Python Source Code Vulnerability Detection

要約

ソフトウェアの脆弱性はサイバー攻撃が蔓延する根本的な理由であり、その特定はサイバー セキュリティにおいて重要かつ困難な問題です。
このペーパーでは、特に Python プログラミング言語のソース コードの脆弱性検出にさまざまな機械学習アルゴリズムを適用して比較します。
実験による評価では、双方向長期短期記憶 (BiLSTM) モデルが優れたパフォーマンス (平均精度 = 98.6%、平均 F スコア = 94.7%、平均精度 = 96.2%、平均再現率 = 93.3%、平均 ROC = ) を達成していることが実証されています。
99.3%)、これにより、Python ソース コードの脆弱性検出の新しいベンチマークが確立されました。

要約(オリジナル)

Software vulnerabilities are a fundamental reason for the prevalence of cyber attacks and their identification is a crucial yet challenging problem in cyber security. In this paper, we apply and compare different machine learning algorithms for source code vulnerability detection specifically for Python programming language. Our experimental evaluation demonstrates that our Bidirectional Long Short-Term Memory (BiLSTM) model achieves a remarkable performance (average Accuracy = 98.6%, average F-Score = 94.7%, average Precision = 96.2%, average Recall = 93.3%, average ROC = 99.3%), thereby, establishing a new benchmark for vulnerability detection in Python source code.

arxiv情報

著者 Talaya Farasat,Joachim Posegga
発行日 2024-04-15 08:01:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.SE パーマリンク