Cyber Knowledge Completion Using Large Language Models

要約

モノのインターネット (IoT) がサイバー物理システム (CPS) に統合されたことで、サイバー攻撃対象領域が拡大し、新たな脆弱性を悪用する可能性のある新たな高度な脅威が導入されています。
サイバーセキュリティの知識が不完全で古いため、CPS のリスクを評価することはますます困難になっています。
これは、より適切な情報に基づいたリスク評価と緩和戦略が緊急に必要であることを浮き彫りにしています。
これまでの取り組みは、ルールベースの自然言語処理 (NLP) ツールに依存して脆弱性、弱点、攻撃パターンをマッピングしていましたが、大規模言語モデル (LLM) の最近の進歩により、推論の改善を通じてサイバー攻撃の知識の補完を強化するまたとない機会が提供されています。
推論、要約機能。
埋め込みモデルを適用して攻撃パターンと敵対的手法に関する情報をカプセル化し、ベクトル埋め込みを使用してそれらの間のマッピングを生成します。
さらに、事前トレーニングされたモデルを活用して、脅威パターンのさまざまな分類間に構造化されたマッピングを作成する、検索拡張生成 (RAG) ベースのアプローチを提案します。
さらに、手動でラベル付けされた小さなデータセットを使用して、提案された RAG ベースのアプローチをベースラインの標準二値分類モデルと比較します。
したがって、提案されたアプローチは、サイバー攻撃のナレッジ グラフの完成という課題に対処するための包括的なフレームワークを提供します。

要約(オリジナル)

The integration of the Internet of Things (IoT) into Cyber-Physical Systems (CPSs) has expanded their cyber-attack surface, introducing new and sophisticated threats with potential to exploit emerging vulnerabilities. Assessing the risks of CPSs is increasingly difficult due to incomplete and outdated cybersecurity knowledge. This highlights the urgent need for better-informed risk assessments and mitigation strategies. While previous efforts have relied on rule-based natural language processing (NLP) tools to map vulnerabilities, weaknesses, and attack patterns, recent advancements in Large Language Models (LLMs) present a unique opportunity to enhance cyber-attack knowledge completion through improved reasoning, inference, and summarization capabilities. We apply embedding models to encapsulate information on attack patterns and adversarial techniques, generating mappings between them using vector embeddings. Additionally, we propose a Retrieval-Augmented Generation (RAG)-based approach that leverages pre-trained models to create structured mappings between different taxonomies of threat patterns. Further, we use a small hand-labeled dataset to compare the proposed RAG-based approach to a baseline standard binary classification model. Thus, the proposed approach provides a comprehensive framework to address the challenge of cyber-attack knowledge graph completion.

arxiv情報

著者 Braden K Webb,Sumit Purohit,Rounak Meyur
発行日 2024-09-24 15:20:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CR, H.3.3 パーマリンク