「cs.CR」カテゴリーアーカイブ

The Fire Thief Is Also the Keeper: Balancing Usability and Privacy in Prompts

投稿日: 2024年6月21日作成者: jarxiv

要約オンラインチャットボットの急速な導入は、人工知能の大幅な進歩を表していま … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CR | コメントを受け付けていません

Mind the Privacy Unit! User-Level Differential Privacy for Language Model Fine-Tuning

投稿日: 2024年6月21日作成者: jarxiv

要約大規模言語モデル (LLM) は、さまざまなドメインにわたる複雑なタスクに … 続きを読む →

カテゴリー: cs.CL, cs.CR, cs.LG | コメントを受け付けていません

PostMark: A Robust Blackbox Watermark for Large Language Models

投稿日: 2024年6月21日作成者: jarxiv

要約 LLM で生成されたテキストを検出する最も効果的な手法は、モデルのデコード … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG | コメントを受け付けていません

DREW : Towards Robust Data Provenance by Leveraging Error-Controlled Watermarking

投稿日: 2024年6月21日作成者: jarxiv

要約データの出所を特定することは、データ所有権の保護、メディアフォレンジック、 … 続きを読む →

カテゴリー: cs.CR, cs.CV | コメントを受け付けていません

On Differentially Private Subspace Estimation in a Distribution-Free Setting

投稿日: 2024年6月19日作成者: jarxiv

要約プライベートデータ分析は、コストの増加につながる、次元の呪いとして知られ … 続きを読む →

カテゴリー: cs.CR, cs.DS, cs.LG | コメントを受け付けていません

Leveraging Generative Models for Covert Messaging: Challenges and Tradeoffs for ‘Dead-Drop’ Deployments

投稿日: 2024年6月19日作成者: jarxiv

要約人間が作成したコンテンツの最先端の生成モデルは、ステガノグラフィー通信への … 続きを読む →

カテゴリー: cs.CR, cs.LG | コメントを受け付けていません

Jailbreaking Leading Safety-Aligned LLMs with Simple Adaptive Attacks

投稿日: 2024年6月19日作成者: jarxiv

要約私たちは、安全性を重視した最新の LLM であっても、単純な適応ジェイルブ … 続きを読む →

カテゴリー: cs.AI, cs.CR, cs.LG, stat.ML | コメントを受け付けていません

Extracting Training Data from Unconditional Diffusion Models

投稿日: 2024年6月19日作成者: jarxiv

要約拡散確率モデル (DPM) が生成人工知能 (AI) の主流モデルとして採 … 続きを読む →

カテゴリー: cs.CR, cs.CV, cs.LG | コメントを受け付けていません

Adversarial Attacks on Multimodal Agents

投稿日: 2024年6月19日作成者: jarxiv

要約現在、ビジョン対応言語モデル (VLM) は、実際の環境でアクションを実行 … 続きを読む →

カテゴリー: cs.CL, cs.CR, cs.CV, cs.LG | コメントを受け付けていません

Knowledge-to-Jailbreak: One Knowledge Point Worth One Attack

投稿日: 2024年6月18日作成者: jarxiv

要約大規模言語モデル (LLM) はさまざまなドメインにますます適用されており … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CR | コメントを受け付けていません

「cs.CR」カテゴリーアーカイブ

The Fire Thief Is Also the Keeper: Balancing Usability and Privacy in Prompts

Mind the Privacy Unit! User-Level Differential Privacy for Language Model Fine-Tuning

PostMark: A Robust Blackbox Watermark for Large Language Models

DREW : Towards Robust Data Provenance by Leveraging Error-Controlled Watermarking

On Differentially Private Subspace Estimation in a Distribution-Free Setting

Leveraging Generative Models for Covert Messaging: Challenges and Tradeoffs for ‘Dead-Drop’ Deployments

Jailbreaking Leading Safety-Aligned LLMs with Simple Adaptive Attacks

Extracting Training Data from Unconditional Diffusion Models

Adversarial Attacks on Multimodal Agents

Knowledge-to-Jailbreak: One Knowledge Point Worth One Attack

最近の投稿

最近のコメント

アーカイブ

カテゴリー