Is the Digital Forensics and Incident Response Pipeline Ready for Text-Based Threats in LLM Era?

要約

生成 AI の時代において、ニューラル テキスト ジェネレーター (NTG) の広範な導入により、特にデジタル フォレンジックとインシデント対応 (DFIR) の領域において、新たなサイバーセキュリティの課題が生じています。
これらの課題には主に、スピアフィッシングや偽情報キャンペーンなどの高度な攻撃の背後にあるソースの検出と特定が含まれます。
NTG が進化するにつれて、人間が作成したテキストと NTG が作成したテキストを区別する作業は非常に複雑になります。
このペーパーでは、テキストベースのセキュリティ システム向けに調整された DFIR パイプラインを厳密に評価し、特に NTG で作成されたテキストの検出と作成者の帰属という課題に焦点を当てています。
CS-ACT と呼ばれる新しい人間と NTG の共著によるテキスト攻撃を導入することで、私たちの研究は従来の DFIR 手法の重大な脆弱性を明らかにし、理想的なシナリオと現実世界の状況との間の矛盾を浮き彫りにしました。
最新の GPT-4 までの 14 の多様なデータセットと 43 の固有の NTG を利用した私たちの調査では、フォレンジック プロファイリングの段階、特に著作者の帰属を NTG に帰する際の重大な脆弱性を特定しています。
私たちの包括的な評価では、モデルの洗練さや NTG 内の独特のスタイルの欠如などの要因が、これらの脆弱性の重大な要因であると指摘しています。
私たちの調査結果は、敵対的学習の組み込み、NTG の様式化、ソース帰属を強化するための NTG リネージのマッピングによる階層帰属の実装など、より洗練された適応可能な戦略の必要性を強調しています。
これにより、将来の研究と、より復元力の高いテキストベースのセキュリティ システムの開発の準備が整います。

要約(オリジナル)

In the era of generative AI, the widespread adoption of Neural Text Generators (NTGs) presents new cybersecurity challenges, particularly within the realms of Digital Forensics and Incident Response (DFIR). These challenges primarily involve the detection and attribution of sources behind advanced attacks like spearphishing and disinformation campaigns. As NTGs evolve, the task of distinguishing between human and NTG-authored texts becomes critically complex. This paper rigorously evaluates the DFIR pipeline tailored for text-based security systems, specifically focusing on the challenges of detecting and attributing authorship of NTG-authored texts. By introducing a novel human-NTG co-authorship text attack, termed CS-ACT, our study uncovers significant vulnerabilities in traditional DFIR methodologies, highlighting discrepancies between ideal scenarios and real-world conditions. Utilizing 14 diverse datasets and 43 unique NTGs, up to the latest GPT-4, our research identifies substantial vulnerabilities in the forensic profiling phase, particularly in attributing authorship to NTGs. Our comprehensive evaluation points to factors such as model sophistication and the lack of distinctive style within NTGs as significant contributors for these vulnerabilities. Our findings underscore the necessity for more sophisticated and adaptable strategies, such as incorporating adversarial learning, stylizing NTGs, and implementing hierarchical attribution through the mapping of NTG lineages to enhance source attribution. This sets the stage for future research and the development of more resilient text-based security systems.

arxiv情報

著者 Avanti Bhandarkar,Ronald Wilson,Anushka Swarup,Mengdi Zhu,Damon Woodard
発行日 2024-07-25 08:42:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.CR パーマリンク