cs.CR」カテゴリーアーカイブ

Generate-then-Verify: Reconstructing Data from Limited Published Statistics

要約 集計統計から表形式データを再構築する問題を研究します。攻撃者は、集合体を考 … 続きを読む

カテゴリー: cs.CR, cs.LG, stat.ML | コメントする

One Pic is All it Takes: Poisoning Visual Document Retrieval Augmented Generation with a Single Image

要約 マルチモーダル検索拡張生成(M-RAG)は、事実知識ベース(KB)を使用し … 続きを読む

カテゴリー: cs.CL, cs.CR, cs.CV, cs.IR | コメントする

LLMail-Inject: A Dataset from a Realistic Adaptive Prompt Injection Challenge

要約 間接的な迅速な噴射攻撃は、入力の命令とデータを区別するために、大規模な言語 … 続きを読む

カテゴリー: cs.AI, cs.CR | コメントする

Trustworthy AI: Safety, Bias, and Privacy — A Survey

要約 人工知能システムの能力は大幅に進歩していますが、これらのシステムは依然とし … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG | コメントする

Provably Cost-Sensitive Adversarial Defense via Randomized Smoothing

要約 MLモデルは重要なアプリケーションでますます展開されているため、敵対的な摂 … 続きを読む

カテゴリー: cs.CR, cs.LG | コメントする

PrisonBreak: Jailbreaking Large Language Models with Fewer Than Twenty-Five Targeted Bit-flips

要約 モデルパラメーターのターゲットを絞ったビットワイズ腐敗を通じてジェイルブレ … 続きを読む

カテゴリー: cs.CL, cs.CR, cs.LG | コメントする

Activation Approximations Can Incur Safety Vulnerabilities Even in Aligned LLMs: Comprehensive Analysis and Defense

要約 大規模な言語モデル(LLM)は、さまざまなドメインにわたって顕著な機能を紹 … 続きを読む

カテゴリー: cs.AI, cs.CR | コメントする

Do Concept Replacement Techniques Really Erase Unacceptable Concepts?

要約 生成モデル、特に拡散ベースのテキストからイメージ(T2I)モデルは、驚くべ … 続きを読む

カテゴリー: cs.CR, cs.CV | コメントする

SoK: Data Reconstruction Attacks Against Machine Learning Models: Definition, Metrics, and Benchmark

要約 アクセスが制限されているターゲットモデルのトレーニングデータセットを回復す … 続きを読む

カテゴリー: cs.CR, cs.LG | コメントする

TokenBreak: Bypassing Text Classification Models Through Token Manipulation

要約 自然言語処理(NLP)モデルは、分類や生成などのテキスト関連のタスクに使用 … 続きを読む

カテゴリー: cs.CR, cs.LG | コメントする