Automating the Detection of Code Vulnerabilities by Analyzing GitHub Issues

要約

今日のデジタル環境では、タイムリーかつ正確な脆弱性検出の重要性が大幅に高まっています。
このペーパーでは、トランスフォーマー ベースのモデルと機械学習技術を活用して、GitHub の問題を分析することでソフトウェアの脆弱性の特定を自動化する新しいアプローチを紹介します。
脆弱性検出に関連する GitHub の問題を分類するために特別に設計された新しいデータセットを紹介します。
次に、さまざまな分類手法を検証して、その有効性を判断します。
この結果は、このアプローチが脆弱性の早期検出において現実世界に応用できる可能性を示しており、これによりソフトウェアの脆弱性が悪用される可能性が大幅に減少する可能性があります。
この研究は、自動検出のためのスケーラブルで計算効率の高いフレームワークを提供し、公式通知の前に侵害されたソフトウェアの使用を防止できるようにすることで、この分野に大きく貢献します。
この取り組みにより、オープンソース ソフトウェア エコシステムのセキュリティが強化される可能性があります。

要約(オリジナル)

In today’s digital landscape, the importance of timely and accurate vulnerability detection has significantly increased. This paper presents a novel approach that leverages transformer-based models and machine learning techniques to automate the identification of software vulnerabilities by analyzing GitHub issues. We introduce a new dataset specifically designed for classifying GitHub issues relevant to vulnerability detection. We then examine various classification techniques to determine their effectiveness. The results demonstrate the potential of this approach for real-world application in early vulnerability detection, which could substantially reduce the window of exploitation for software vulnerabilities. This research makes a key contribution to the field by providing a scalable and computationally efficient framework for automated detection, enabling the prevention of compromised software usage before official notifications. This work has the potential to enhance the security of open-source software ecosystems.

arxiv情報

著者 Daniele Cipollone,Changjie Wang,Mariano Scazzariello,Simone Ferlin,Maliheh Izadi,Dejan Kostic,Marco Chiesa
発行日 2025-01-09 14:13:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CR, cs.SE, D.2.5 パーマリンク