cs.CR」カテゴリーアーカイブ

Backdoor Cleaning without External Guidance in MLLM Fine-tuning

要約 マルチモーダル大手言語モデル(MLLMS)は、ユーザーがサビされたデータセ … 続きを読む

カテゴリー: cs.CR, cs.CV | Backdoor Cleaning without External Guidance in MLLM Fine-tuning はコメントを受け付けていません

Alignment Under Pressure: The Case for Informed Adversaries When Evaluating LLM Defenses

要約 大規模な言語モデル(LLMS)は、チャットボットからエージェントシステムに … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG | Alignment Under Pressure: The Case for Informed Adversaries When Evaluating LLM Defenses はコメントを受け付けていません

Scalable Defense against In-the-wild Jailbreaking Attacks with Safety Context Retrieval

要約 大規模な言語モデル(LLM)は、侵入攻撃に対して脆弱であることが知られてお … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG | Scalable Defense against In-the-wild Jailbreaking Attacks with Safety Context Retrieval はコメントを受け付けていません

An In-Depth Investigation of Data Collection in LLM App Ecosystems

要約 LLMアプリ(ツール)エコシステムは急速に進化して、広範なユーザーデータ収 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.CY, cs.LG | An In-Depth Investigation of Data Collection in LLM App Ecosystems はコメントを受け付けていません

FragFake: A Dataset for Fine-Grained Detection of Edited Images with Vision Language Models

要約 特に、最新の拡散モデルと画像編集方法が非常に現実的な操作を生成する可能性が … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.CV | FragFake: A Dataset for Fine-Grained Detection of Edited Images with Vision Language Models はコメントを受け付けていません

Adaptive Pruning of Deep Neural Networks for Resource-Aware Embedded Intrusion Detection on the Edge

要約 人工ニューラルネットワーク剪定は、ネットワークの予測機能を維持しようとしな … 続きを読む

カテゴリー: cs.CR, cs.LG | Adaptive Pruning of Deep Neural Networks for Resource-Aware Embedded Intrusion Detection on the Edge はコメントを受け付けていません

sudoLLM : On Multi-role Alignment of Language Models

要約 ユーザー認証ベースのアクセス特権は、多くの安全性が批判的なシステムの重要な … 続きを読む

カテゴリー: cs.CL, cs.CR, I.2.7 | sudoLLM : On Multi-role Alignment of Language Models はコメントを受け付けていません

Can Large Language Models Really Recognize Your Name?

要約 大規模な言語モデル(LLM)は、機密のユーザーデータを保護するためにますま … 続きを読む

カテゴリー: cs.AI, cs.CR | Can Large Language Models Really Recognize Your Name? はコメントを受け付けていません

Trustworthy Reputation Games and Applications to Proof-of-Reputation Blockchains

要約 評判システムは、ユーザーの行動に関するデータを収集して集約することにより、 … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.GT | Trustworthy Reputation Games and Applications to Proof-of-Reputation Blockchains はコメントを受け付けていません

Training-Free Watermarking for Autoregressive Image Generation

要約 目に見えない画像の透かしは、画像の所有権を保護し、視覚生成モデルの悪意のあ … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.CV | Training-Free Watermarking for Autoregressive Image Generation はコメントを受け付けていません