要約
ソフトウェアの脆弱性は、クラッシュ、データ損失、セキュリティ侵害などのさまざまな弊害を引き起こし、品質を著しく妨げ、ソフトウェア アプリケーションやシステムの市場採用に影響を与えます。
自動化されたソフトウェア テスト、障害の位置特定、修復などの従来の方法が集中的に研究されてきましたが、静的分析ツールが最も一般的に使用されており、固有の誤検知率があり、開発者の生産性にとって大きな課題となっています。
大規模言語モデル (LLM) は、これらの永続的な問題に対する有望な解決策を提供します。
その中でも、FalconLLM は、複雑なパターンと複雑な脆弱性の特定において大きな可能性を示しており、したがってソフトウェアの脆弱性の検出において重要です。
このペーパーでは、FalconLLM がサイバーセキュリティ アプリケーション向けに初めて微調整され、FalconLLM に基づいて構築された革新的なモデル アーキテクチャである SecureFalcon が紹介されます。
SecureFalcon は、脆弱な C コード サンプルと脆弱でない C コード サンプルを区別するようにトレーニングされています。
私たちは、生成人工知能 (AI) とそのパフォーマンスを評価するための形式的検証のおかげで構築された新しいトレーニング データセット FormAI を構築します。
SecureFalcon は、ソフトウェア脆弱性の検出において 94% という驚異的な精度を達成し、サイバーセキュリティにおけるソフトウェア脆弱性検出方法を再定義する大きな可能性を強調しました。
要約(オリジナル)
Software vulnerabilities leading to various detriments such as crashes, data loss, and security breaches, significantly hinder the quality, affecting the market adoption of software applications and systems. Although traditional methods such as automated software testing, fault localization, and repair have been intensively studied, static analysis tools are most commonly used and have an inherent false positives rate, posing a solid challenge to developer productivity. Large Language Models (LLMs) offer a promising solution to these persistent issues. Among these, FalconLLM has shown substantial potential in identifying intricate patterns and complex vulnerabilities, hence crucial in software vulnerability detection. In this paper, for the first time, FalconLLM is being fine-tuned for cybersecurity applications, thus introducing SecureFalcon, an innovative model architecture built upon FalconLLM. SecureFalcon is trained to differentiate between vulnerable and non-vulnerable C code samples. We build a new training dataset, FormAI, constructed thanks to Generative Artificial Intelligence (AI) and formal verification to evaluate its performance. SecureFalcon achieved an impressive 94% accuracy rate in detecting software vulnerabilities, emphasizing its significant potential to redefine software vulnerability detection methods in cybersecurity.
arxiv情報
著者 | Mohamed Amine Ferrag,Ammar Battah,Norbert Tihanyi,Merouane Debbah,Thierry Lestable,Lucas C. Cordeiro |
発行日 | 2023-07-13 08:34:09+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google