「cs.CR」カテゴリーアーカイブ

MIBench: A Comprehensive Benchmark for Model Inversion Attack and Defense

投稿日: 2024年10月8日作成者: jarxiv

要約モデル反転 (MI) 攻撃は、ターゲットモデルの出力情報を利用してプライ … 続きを読む →

カテゴリー: cs.CR, cs.CV | コメントを受け付けていません

SoK: Membership Inference Attacks on LLMs are Rushing Nowhere (and How to Fix It)

投稿日: 2024年10月8日作成者: jarxiv

要約 LLM がトレーニングデータを記憶しているかどうか、またプライバシーの漏 … 続きを読む →

カテゴリー: cs.CL, cs.CR, cs.LG | コメントを受け付けていません

Gradient-based Jailbreak Images for Multimodal Fusion Models

投稿日: 2024年10月7日作成者: jarxiv

要約言語モデルを画像入力で補強することで、離散的な最適化を必要とするテキスト入 … 続きを読む →

カテゴリー: cs.AI, cs.CR | コメントを受け付けていません

Buckle Up: Robustifying LLMs at Every Customization Stage via Data Curation

投稿日: 2024年10月7日作成者: jarxiv

要約大規模言語モデル（LLM）は、「カスタマイズ」として知られるプロセスを通じ … 続きを読む →

カテゴリー: cs.AI, cs.CR | コメントを受け付けていません

Ward: Provable RAG Dataset Inference via LLM Watermarks

投稿日: 2024年10月7日作成者: jarxiv

要約検索補強型生成（RAG）は、生成中に外部データを取り込むことを可能にするこ … 続きを読む →

カテゴリー: cs.AI, cs.CR, cs.LG | コメントを受け付けていません

EIA: Environmental Injection Attack on Generalist Web Agents for Privacy Leakage

投稿日: 2024年10月7日作成者: jarxiv

要約ジェネラリスト型ウェブエージェントは、実際のウェブサイト上で様々なタスクを … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG | コメントを受け付けていません

EIA: Environmental Injection Attack on Generalist Web Agents for Privacy Leakage

投稿日: 2024年10月4日作成者: jarxiv

要約ジェネラリスト型ウェブエージェントは、実際のウェブサイト上で様々なタスクを … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG | コメントを受け付けていません

Agent Security Bench (ASB): Formalizing and Benchmarking Attacks and Defenses in LLM-based Agents

投稿日: 2024年10月4日作成者: jarxiv

要約大規模言語モデル（Large Language Models：LLM）を搭 … 続きを読む →

カテゴリー: cs.AI, cs.CR | コメントを受け付けていません

Discovering Clues of Spoofed LM Watermarks

投稿日: 2024年10月4日作成者: jarxiv

要約 LLM透かしは、LLMで生成されたテキストの所有権を示す有望な方法として注 … 続きを読む →

カテゴリー: cs.AI, cs.CR, cs.LG | コメントを受け付けていません

SteerDiff: Steering towards Safe Text-to-Image Diffusion Models

投稿日: 2024年10月4日作成者: jarxiv

要約 T2I（Text-to-image）拡散モデルは、テキストを正確に配置した … 続きを読む →

カテゴリー: cs.AI, cs.CR, cs.CV | コメントを受け付けていません

「cs.CR」カテゴリーアーカイブ

MIBench: A Comprehensive Benchmark for Model Inversion Attack and Defense

SoK: Membership Inference Attacks on LLMs are Rushing Nowhere (and How to Fix It)

Gradient-based Jailbreak Images for Multimodal Fusion Models

Buckle Up: Robustifying LLMs at Every Customization Stage via Data Curation

Ward: Provable RAG Dataset Inference via LLM Watermarks

EIA: Environmental Injection Attack on Generalist Web Agents for Privacy Leakage

EIA: Environmental Injection Attack on Generalist Web Agents for Privacy Leakage

Agent Security Bench (ASB): Formalizing and Benchmarking Attacks and Defenses in LLM-based Agents

Discovering Clues of Spoofed LM Watermarks

SteerDiff: Steering towards Safe Text-to-Image Diffusion Models

最近の投稿

最近のコメント

アーカイブ

カテゴリー