cs.CR」カテゴリーアーカイブ

Harmful Fine-tuning Attacks and Defenses for Large Language Models: A Survey

要約 最近の調査によると、サービスとしての微調整の初期段階のビジネス モデルは、 … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.LG | Harmful Fine-tuning Attacks and Defenses for Large Language Models: A Survey はコメントを受け付けていません

Retraining with Predicted Hard Labels Provably Increases Model Accuracy

要約 \textit{ノイズのあるラベル} でトレーニングされたモデルのパフォー … 続きを読む

カテゴリー: cs.CR, cs.LG, stat.ML | Retraining with Predicted Hard Labels Provably Increases Model Accuracy はコメントを受け付けていません

Unlearning Backdoor Attacks for LLMs with Weak-to-Strong Knowledge Distillation

要約 パラメーター効率の良い微調整 (PEFT) は、大規模言語モデル (LLM … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR | Unlearning Backdoor Attacks for LLMs with Weak-to-Strong Knowledge Distillation はコメントを受け付けていません

BlackDAN: A Black-Box Multi-Objective Approach for Effective and Contextual Jailbreaking of Large Language Models

要約 大規模言語モデル (LLM) はさまざまなタスクにわたって優れた機能を発揮 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG, cs.NE | BlackDAN: A Black-Box Multi-Objective Approach for Effective and Contextual Jailbreaking of Large Language Models はコメントを受け付けていません

When LLMs Go Online: The Emerging Threat of Web-Enabled LLMs

要約 大規模言語モデル (LLM) の最近の進歩により、LLM は計画を立て、さ … 続きを読む

カテゴリー: cs.AI, cs.CR | When LLMs Go Online: The Emerging Threat of Web-Enabled LLMs はコメントを受け付けていません

Privacy-Preserving Decentralized AI with Confidential Computing

要約 このペーパーでは、Web3 ドメイン用に設計された分散型 AI プラットフ … 続きを読む

カテゴリー: cs.AI, cs.CR | Privacy-Preserving Decentralized AI with Confidential Computing はコメントを受け付けていません

Private Counterfactual Retrieval

要約 透明性と説明可能性は、リスクの高いアプリケーションでブラックボックス機械学 … 続きを読む

カテゴリー: cs.CR, cs.IT, cs.LG, eess.SP, math.IT | Private Counterfactual Retrieval はコメントを受け付けていません

On the Role of Attention Heads in Large Language Model Safety

要約 大規模言語モデル (LLM) は、複数の言語タスクで最先端のパフォーマンス … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG | On the Role of Attention Heads in Large Language Model Safety はコメントを受け付けていません

Persistent Pre-Training Poisoning of LLMs

要約 大規模な言語モデルは、Web から収集した何兆ものトークンで構成される未管 … 続きを読む

カテゴリー: cs.AI, cs.CR | Persistent Pre-Training Poisoning of LLMs はコメントを受け付けていません

Privacy-Preserving Decentralized AI with Confidential Computing

要約 このペーパーでは、Web3 ドメイン用に設計された分散型 AI プラットフ … 続きを読む

カテゴリー: cs.AI, cs.CR | Privacy-Preserving Decentralized AI with Confidential Computing はコメントを受け付けていません