cs.CR」カテゴリーアーカイブ

Espresso: Robust Concept Filtering in Text-to-Image Models

要約 拡散ベースのテキストから画像モデルは、インターネットから削られた大きなデー … 続きを読む

カテゴリー: cs.CR, cs.CV | Espresso: Robust Concept Filtering in Text-to-Image Models はコメントを受け付けていません

SafeAgentBench: A Benchmark for Safe Task Planning of Embodied LLM Agents

要約 大規模な言語モデル(LLMS)の統合により、具体化されたエージェントはシー … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.RO | SafeAgentBench: A Benchmark for Safe Task Planning of Embodied LLM Agents はコメントを受け付けていません

Towards Robust and Secure Embodied AI: A Survey on Vulnerabilities and Attacks

要約 ロボットや自動運転車を含む具体化されたAIシステムは、環境レベルとシステム … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.RO | Towards Robust and Secure Embodied AI: A Survey on Vulnerabilities and Attacks はコメントを受け付けていません

Topic-FlipRAG: Topic-Orientated Adversarial Opinion Manipulation Attacks to Retrieval-Augmented Generation Models

要約 大規模な言語モデル(LLM)に基づいた検索された生成(RAG)システムは、 … 続きを読む

カテゴリー: cs.CL, cs.CR, cs.IR | Topic-FlipRAG: Topic-Orientated Adversarial Opinion Manipulation Attacks to Retrieval-Augmented Generation Models はコメントを受け付けていません

Ward: Provable RAG Dataset Inference via LLM Watermarks

要約 RAGにより、LLMは外部データを簡単に組み込むことができ、コンテンツの不 … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.LG | Ward: Provable RAG Dataset Inference via LLM Watermarks はコメントを受け付けていません

Unveiling ECC Vulnerabilities: LSTM Networks for Operation Recognition in Side-Channel Attacks

要約 楕円曲線暗号化に対するサイドチャネル攻撃を実行するための新しいアプローチを … 続きを読む

カテゴリー: cs.CR, cs.LG | Unveiling ECC Vulnerabilities: LSTM Networks for Operation Recognition in Side-Channel Attacks はコメントを受け付けていません

Institutional Platform for Secure Self-Service Large Language Model Exploration

要約 このペーパーでは、ケンタッキー大学応用AIセンターが開発したユーザーフレン … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR | Institutional Platform for Secure Self-Service Large Language Model Exploration はコメントを受け付けていません

Detecting Benchmark Contamination Through Watermarking

要約 ベンチマークの汚染は、テストセットでモデルがトレーニングされているかどうか … 続きを読む

カテゴリー: cs.AI, cs.CR | Detecting Benchmark Contamination Through Watermarking はコメントを受け付けていません

Emoti-Attack: Zero-Perturbation Adversarial Attacks on NLP Systems via Emoji Sequences

要約 Deep Neural Networks(DNNS)は、Natural L … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR | Emoti-Attack: Zero-Perturbation Adversarial Attacks on NLP Systems via Emoji Sequences はコメントを受け付けていません

Emergent Misalignment: Narrow finetuning can produce broadly misaligned LLMs

要約 LLMSとアラインメントに関する驚くべき結果を提示します。 私たちの実験で … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG | Emergent Misalignment: Narrow finetuning can produce broadly misaligned LLMs はコメントを受け付けていません