MoRSE: Bridging the Gap in Cybersecurity Expertise with Retrieval Augmented Generation

要約

本稿では、サイバーセキュリティに特化した初の AI チャットボットである MoRSE (Mixture of RAGs Security Experts) を紹介します。
MoRSE は、サイバーセキュリティに関する包括的かつ完全な知識を提供することを目的としています。
MoRSE は、多次元サイバーセキュリティ コンテキストから情報を取得して整理するために設計された 2 つの RAG (Retrieval Augmented Generation) システムを使用します。
MoRSE は、意味的に関連する情報をさまざまな形式や構造で取得するために連携して動作する並列取得機能を使用する点で、従来の RAG とは異なります。
パラメトリック知識ベースに依存する従来の大規模言語モデル (LLM) とは異なり、MoRSE はユーザーのクエリに応じてノンパラメトリック知識ベースから関連ドキュメントを取得します。
その後、MoRSE はこの情報を使用して正確な回答を生成します。
さらに、MoRSE はナレッジ ベースのリアルタイム更新の恩恵を受け、再トレーニングなしで継続的にナレッジを強化できます。
私たちは、サイバーセキュリティ固有の 600 の質問に基づいてシステムを評価し、他の最先端の LLM に対する MoRSE の有効性を評価しました。
実験による評価では、GPT-4 や Mixtral 7×8 などの既知のソリューションと比較して、回答の関連性と正確さの点で 10\% 以上の向上が見られました。

要約(オリジナル)

In this paper, we introduce MoRSE (Mixture of RAGs Security Experts), the first specialised AI chatbot for cybersecurity. MoRSE aims to provide comprehensive and complete knowledge about cybersecurity. MoRSE uses two RAG (Retrieval Augmented Generation) systems designed to retrieve and organize information from multidimensional cybersecurity contexts. MoRSE differs from traditional RAGs by using parallel retrievers that work together to retrieve semantically related information in different formats and structures. Unlike traditional Large Language Models (LLMs) that rely on Parametric Knowledge Bases, MoRSE retrieves relevant documents from Non-Parametric Knowledge Bases in response to user queries. Subsequently, MoRSE uses this information to generate accurate answers. In addition, MoRSE benefits from real-time updates to its knowledge bases, enabling continuous knowledge enrichment without retraining. We have evaluated the effectiveness of MoRSE against other state-of-the-art LLMs, evaluating the system on 600 cybersecurity specific questions. The experimental evaluation has shown that the improvement in terms of relevance and correctness of the answer is more than 10\% compared to known solutions such as GPT-4 and Mixtral 7×8.

arxiv情報

著者 Marco Simoni,Andrea Saracino,Vinod P.,Mauro Conti
発行日 2024-07-22 15:53:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CR, cs.IR パーマリンク