cs.CR」カテゴリーアーカイブ

OBLIVIATE: Robust and Practical Machine Unlearning for Large Language Models

要約 敏感、著作権、または有毒な含有量を記憶する広範なコーパスリスクを訓練された … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG | OBLIVIATE: Robust and Practical Machine Unlearning for Large Language Models はコメントを受け付けていません

BadLingual: A Novel Lingual-Backdoor Attack against Large Language Models

要約 この論文では、大規模な言語モデル(LLMS)に対する新しい形式のバックドア … 続きを読む

カテゴリー: cs.CL, cs.CR | BadLingual: A Novel Lingual-Backdoor Attack against Large Language Models はコメントを受け付けていません

The Adaptive Arms Race: Redefining Robustness in AI Security

要約 それらを堅牢にするためのかなりの努力にもかかわらず、現実世界のAIベースの … 続きを読む

カテゴリー: cs.AI, cs.CR | The Adaptive Arms Race: Redefining Robustness in AI Security はコメントを受け付けていません

LlamaFirewall: An open source guardrail system for building secure AI agents

要約 大規模な言語モデル(LLMS)は、シンプルなチャットボットから、本番コード … 続きを読む

カテゴリー: cs.AI, cs.CR | LlamaFirewall: An open source guardrail system for building secure AI agents はコメントを受け付けていません

Large Language Models as Carriers of Hidden Messages

要約 単純な微調整は、隠されたテキストを大きな言語モデル(LLM)に埋め込むこと … 続きを読む

カテゴリー: cs.CL, cs.CR | Large Language Models as Carriers of Hidden Messages はコメントを受け付けていません

Privacy Risks and Preservation Methods in Explainable Artificial Intelligence: A Scoping Review

要約 説明可能な人工知能(XAI)は、信頼できるAIの柱として登場し、本来不透明 … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.ET | Privacy Risks and Preservation Methods in Explainable Artificial Intelligence: A Scoping Review はコメントを受け付けていません

Towards Dataset Copyright Evasion Attack against Personalized Text-to-Image Diffusion Models

要約 テキストから画像への拡散(T2I)モデルは急速に進歩し、テキストによるプロ … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.CV | Towards Dataset Copyright Evasion Attack against Personalized Text-to-Image Diffusion Models はコメントを受け付けていません

Attack and defense techniques in large language models: A survey and new perspectives

要約 大規模言語モデル(LLM)は、多くの自然言語処理タスクの中心的存在となって … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG | Attack and defense techniques in large language models: A survey and new perspectives はコメントを受け付けていません

A Character-based Diffusion Embedding Algorithm for Enhancing the Generation Quality of Generative Linguistic Steganographic Texts

要約 高品質のステガノグラフィテキストを生成することは、生成的言語ステガノグラフ … 続きを読む

カテゴリー: cs.CL, cs.CR | A Character-based Diffusion Embedding Algorithm for Enhancing the Generation Quality of Generative Linguistic Steganographic Texts はコメントを受け付けていません

A False Sense of Privacy: Evaluating Textual Data Sanitization Beyond Surface-level Privacy Leakage

要約 機密性の高いテキストデータのサニタイズは、通常、個人を特定できる情報(PI … 続きを読む

カテゴリー: cs.CL, cs.CR, cs.LG | A False Sense of Privacy: Evaluating Textual Data Sanitization Beyond Surface-level Privacy Leakage はコメントを受け付けていません