要約
大規模言語モデル (LLM) は、さまざまなタスクにわたって優れたパフォーマンスを実証しました。
LLM は、外部の脅威、特にサービス拒否 (DoS) 攻撃に対して引き続き脆弱です。
具体的には、LLM-DoS 攻撃は、計算リソースを使い果たし、サービスをブロックすることを目的としています。
ただし、これまでの作品はホワイトボックス攻撃の実行に重点を置き、ブラックボックス設定を無視する傾向がありました。
この研究では、LLM-DoS 攻撃用自動生成 (AutoDoS) と呼ばれる、ブラックボックス LLM 用に設計された自動アルゴリズムを提案します。
AutoDoS は DoS 攻撃ツリーを導入し、プロンプト ノード カバレッジを最適化して、ブラック ボックス条件下での効果を高めます。
私たちの方法は、プロンプトノードのセマンティック改善を通じて強化されたステルス性で既存の防御をバイパスできます。
さらに、基本的な DoS プロンプトに Length Trojan を埋め込むことが、より高い攻撃効率の達成に役立つことを明らかにします。
実験結果では、AutoDoS によってサービスの応答遅延が 250 $\times \uparrow$ 以上増幅され、GPU 使用率とメモリ使用量の点で深刻なリソース消費が発生することが示されています。
私たちのコードは \url{https://github.com/shuita2333/AutoDoS} で入手できます。
要約(オリジナル)
Large Language Models (LLMs) have demonstrated remarkable performance across diverse tasks. LLMs continue to be vulnerable to external threats, particularly Denial-of-Service (DoS) attacks. Specifically, LLM-DoS attacks aim to exhaust computational resources and block services. However, prior works tend to focus on performing white-box attacks, overlooking black-box settings. In this work, we propose an automated algorithm designed for black-box LLMs, called Auto-Generation for LLM-DoS Attack (AutoDoS). AutoDoS introduces DoS Attack Tree and optimizes the prompt node coverage to enhance effectiveness under black-box conditions. Our method can bypass existing defense with enhanced stealthiness via semantic improvement of prompt nodes. Furthermore, we reveal that implanting Length Trojan in Basic DoS Prompt aids in achieving higher attack efficacy. Experimental results show that AutoDoS amplifies service response latency by over 250 $\times \uparrow$, leading to severe resource consumption in terms of GPU utilization and memory usage. Our code is available at \url{https://github.com/shuita2333/AutoDoS}.
arxiv情報
著者 | Yuanhe Zhang,Zhenhong Zhou,Wei Zhang,Xinyue Wang,Xiaojun Jia,Yang Liu,Sen Su |
発行日 | 2024-12-18 14:19:23+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google