SQLi Detection with ML: A data-source perspective

要約

タイトル – MLを用いたSQLi検知:データソースの観点から

要約 –
– SQLの発明から50年近くが経過しているにもかかわらず、SQLインジェクション攻撃は今日のICTシステムにおける最上位の脆弱性のままであり、そのためSQLi検知は現在も研究の活発な分野のひとつである。
– 最近の研究では、提案される解決策に機械学習技術を組み込んでいる。
– 本稿では、以前のMLベースの結果の欠点に焦点を当て、評価方法、モデルパラメータの最適化、使用されたデータセットの分布、および特徴選択の4つの側面について説明する。
– これらの側面すべてを満足に対処した単一の論文はなかったため、本研究では詳細で包括的な実証分析を提供する。
– さらに、他の分布からのデータを使用して、トレーニング済みのモデルを交差検証する。これは、SQLi検出のためにトレーニングされたMLモデルのこの側面は、これまで研究されていなかった。
– 最後に、実際の産業用SQLiデータセットで発見を検証する。

要約(オリジナル)

Almost 50 years after the invention of SQL, injection attacks are still top-tier vulnerabilities of today’s ICT systems. Consequently, SQLi detection is still an active area of research, where the most recent works incorporate machine learning techniques into the proposed solutions. In this work, we highlight the shortcomings of the previous ML-based results focusing on four aspects: the evaluation methods, the optimization of the model parameters, the distribution of utilized datasets, and the feature selection. Since no single work explored all of these aspects satisfactorily, we fill this gap and provide an in-depth and comprehensive empirical analysis. Moreover, we cross-validate the trained models by using data from other distributions. This aspect of ML models (trained for SQLi detection) was never studied. Yet, the sensitivity of the model’s performance to this is crucial for any real-life deployment. Finally, we validate our findings on a real-world industrial SQLi dataset.

arxiv情報

著者 Balazs Pejo,Nikolett Kapui
発行日 2023-04-24 14:17:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CR, cs.LG パーマリンク