AttackER: Towards Enhancing Cyber-Attack Attribution with a Named Entity Recognition Dataset

要約

サイバー攻撃の帰属は、専門家が攻撃者指向の対策と法的措置を講じることを可能にする重要なプロセスです。
このタスクの複雑な性質を考慮して、アナリストは主に手動でアトリビューションを実行します。
AI、より具体的には自然言語処理 (NLP) 技術を活用して、アトリビューション プロセス中にサイバーセキュリティ アナリストをサポートできます。
これらの手法がどれほど強力であっても、攻撃アトリビューション ドメイン内のデータセットの不足に対処する必要があります。
この研究では、このギャップを埋め、私たちの知る限り、サイバー攻撃の帰属に関する最初のデータセットを提供します。
私たちは、NLP 分野の固有表現認識 (NER) 手法を利用して、サイバーセキュリティ テキストから攻撃属性情報を抽出することを主な目的としてデータセットを設計しました。
他のサイバーセキュリティ NER データセットとは異なり、私たちのデータセットは、フレーズや文章にまたがるものも含め、コンテキストの詳細を含む豊富なアノテーション セットを提供します。
私たちは大規模な実験を実施し、NLP 技術を適用して、攻撃の属性に対するデータセットの有効性を実証しました。
これらの実験は、サイバー攻撃の帰属を目的としたサイバーセキュリティ データセットの NER タスクを改善する大規模言語モデル (LLM) 機能の可能性を浮き彫りにしています。

要約(オリジナル)

Cyber-attack attribution is an important process that allows experts to put in place attacker-oriented countermeasures and legal actions. The analysts mainly perform attribution manually, given the complex nature of this task. AI and, more specifically, Natural Language Processing (NLP) techniques can be leveraged to support cybersecurity analysts during the attribution process. However powerful these techniques are, they need to deal with the lack of datasets in the attack attribution domain. In this work, we will fill this gap and will provide, to the best of our knowledge, the first dataset on cyber-attack attribution. We designed our dataset with the primary goal of extracting attack attribution information from cybersecurity texts, utilizing named entity recognition (NER) methodologies from the field of NLP. Unlike other cybersecurity NER datasets, ours offers a rich set of annotations with contextual details, including some that span phrases and sentences. We conducted extensive experiments and applied NLP techniques to demonstrate the dataset’s effectiveness for attack attribution. These experiments highlight the potential of Large Language Models (LLMs) capabilities to improve the NER tasks in cybersecurity datasets for cyber-attack attribution.

arxiv情報

著者 Pritam Deka,Sampath Rajapaksha,Ruby Rani,Amirah Almutairi,Erisa Karafili
発行日 2024-08-09 16:10:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CR パーマリンク