cs.CR」カテゴリーアーカイブ

MIBench: A Comprehensive Benchmark for Model Inversion Attack and Defense

要約 モデル反転 (MI) 攻撃は、ターゲット モデルの出力情報を利用してプライ … 続きを読む

カテゴリー: cs.CR, cs.CV | MIBench: A Comprehensive Benchmark for Model Inversion Attack and Defense はコメントを受け付けていません

SoK: Membership Inference Attacks on LLMs are Rushing Nowhere (and How to Fix It)

要約 LLM がトレーニング データを記憶しているかどうか、またプライバシーの漏 … 続きを読む

カテゴリー: cs.CL, cs.CR, cs.LG | SoK: Membership Inference Attacks on LLMs are Rushing Nowhere (and How to Fix It) はコメントを受け付けていません

Gradient-based Jailbreak Images for Multimodal Fusion Models

要約 言語モデルを画像入力で補強することで、離散的な最適化を必要とするテキスト入 … 続きを読む

カテゴリー: cs.AI, cs.CR | Gradient-based Jailbreak Images for Multimodal Fusion Models はコメントを受け付けていません

Buckle Up: Robustifying LLMs at Every Customization Stage via Data Curation

要約 大規模言語モデル(LLM)は、「カスタマイズ」として知られるプロセスを通じ … 続きを読む

カテゴリー: cs.AI, cs.CR | Buckle Up: Robustifying LLMs at Every Customization Stage via Data Curation はコメントを受け付けていません

Ward: Provable RAG Dataset Inference via LLM Watermarks

要約 検索補強型生成(RAG)は、生成中に外部データを取り込むことを可能にするこ … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.LG | Ward: Provable RAG Dataset Inference via LLM Watermarks はコメントを受け付けていません

EIA: Environmental Injection Attack on Generalist Web Agents for Privacy Leakage

要約 ジェネラリスト型ウェブエージェントは、実際のウェブサイト上で様々なタスクを … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG | EIA: Environmental Injection Attack on Generalist Web Agents for Privacy Leakage はコメントを受け付けていません

EIA: Environmental Injection Attack on Generalist Web Agents for Privacy Leakage

要約 ジェネラリスト型ウェブエージェントは、実際のウェブサイト上で様々なタスクを … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG | EIA: Environmental Injection Attack on Generalist Web Agents for Privacy Leakage はコメントを受け付けていません

Agent Security Bench (ASB): Formalizing and Benchmarking Attacks and Defenses in LLM-based Agents

要約 大規模言語モデル(Large Language Models:LLM)を搭 … 続きを読む

カテゴリー: cs.AI, cs.CR | Agent Security Bench (ASB): Formalizing and Benchmarking Attacks and Defenses in LLM-based Agents はコメントを受け付けていません

Discovering Clues of Spoofed LM Watermarks

要約 LLM透かしは、LLMで生成されたテキストの所有権を示す有望な方法として注 … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.LG | Discovering Clues of Spoofed LM Watermarks はコメントを受け付けていません

SteerDiff: Steering towards Safe Text-to-Image Diffusion Models

要約 T2I(Text-to-image)拡散モデルは、テキストを正確に配置した … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.CV | SteerDiff: Steering towards Safe Text-to-Image Diffusion Models はコメントを受け付けていません