cs.CR」カテゴリーアーカイブ

MCP Safety Training: Learning to Refuse Falsely Benign MCP Exploits using Improved Preference Alignment

要約 モデルコンテキストプロトコル(MCP)は、生成AIエージェントのシームレス … 続きを読む

カテゴリー: cs.CR, cs.LG | MCP Safety Training: Learning to Refuse Falsely Benign MCP Exploits using Improved Preference Alignment はコメントを受け付けていません

Bayesian Perspective on Memorization and Reconstruction

要約 データの再構築の概念に関する新しいベイジアンの視点を紹介し、この視点を活用 … 続きを読む

カテゴリー: cs.CR, cs.LG | Bayesian Perspective on Memorization and Reconstruction はコメントを受け付けていません

Securing AI Agents with Information-Flow Control

要約 AIエージェントがますます自律的で能力が高まるにつれて、迅速な注入などの脆 … 続きを読む

カテゴリー: cs.AI, cs.CR | Securing AI Agents with Information-Flow Control はコメントを受け付けていません

Keyed Chaotic Tensor Transformations for Secure And Attributable Neural Inference

要約 この作業では、重要なカオス動的変換に基づいて、安全でプライバシーを提供する … 続きを読む

カテゴリー: 37N25, 68T05, 94A60, cs.AI, cs.CR, D.4.6 | Keyed Chaotic Tensor Transformations for Secure And Attributable Neural Inference はコメントを受け付けていません

SimProcess: High Fidelity Simulation of Noisy ICS Physical Processes

要約 産業制御システム(ICS)は、電力網や水処理プラントなどの重要なインフラス … 続きを読む

カテゴリー: cs.CR, cs.LG | SimProcess: High Fidelity Simulation of Noisy ICS Physical Processes はコメントを受け付けていません

AdvAgent: Controllable Blackbox Red-teaming on Web Agents

要約 基礎モデルベースのエージェントは、複雑なタスクの自動化にますます使用され、 … 続きを読む

カテゴリー: cs.CL, cs.CR | AdvAgent: Controllable Blackbox Red-teaming on Web Agents はコメントを受け付けていません

Training RL Agents for Multi-Objective Network Defense Tasks

要約 狭い能力よりも幅広い能力を達成するトレーニングエージェントを強調するオープ … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.LG | Training RL Agents for Multi-Objective Network Defense Tasks はコメントを受け付けていません

Securing Federated Learning against Backdoor Threats with Foundation Model Integration

要約 Federated Learning(FL)は、プライバシーを維持しながら … 続きを読む

カテゴリー: cs.CR, cs.LG | Securing Federated Learning against Backdoor Threats with Foundation Model Integration はコメントを受け付けていません

Evaluating AI cyber capabilities with crowdsourced elicitation

要約 AIシステムがますます有能になるにつれて、攻撃的なサイバーの可能性を理解す … 続きを読む

カテゴリー: cs.AI, cs.CR | Evaluating AI cyber capabilities with crowdsourced elicitation はコメントを受け付けていません

AdInject: Real-World Black-Box Attacks on Web Agents via Advertising Delivery

要約 Vision-Language Model(VLM)ベースのWebエージェ … 続きを読む

カテゴリー: cs.AI, cs.CR | AdInject: Real-World Black-Box Attacks on Web Agents via Advertising Delivery はコメントを受け付けていません