cs.CR」カテゴリーアーカイブ

Tree of Attacks: Jailbreaking Black-Box LLMs Automatically

要約 大規模言語モデル(Large Language Models: LLM)は … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG, stat.ML | Tree of Attacks: Jailbreaking Black-Box LLMs Automatically はコメントを受け付けていません

Hot PATE: Private Aggregation of Distributions for Diverse Task

要約 Private Aggregation of Teacher Ensemb … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.DS, cs.LG | Hot PATE: Private Aggregation of Distributions for Diverse Task はコメントを受け付けていません

Hashmarks: Privacy-Preserving Benchmarks for High-Stakes AI Evaluation

要約 バイオテロやサイバー戦争など、センシティブなトピックに関連する言語モデルの … 続きを読む

カテゴリー: cs.CR, cs.LG, cs.SE | Hashmarks: Privacy-Preserving Benchmarks for High-Stakes AI Evaluation はコメントを受け付けていません

Ignore This Title and HackAPrompt: Exposing Systemic Vulnerabilities of LLMs through a Global Scale Prompt Hacking Competition

要約 大規模言語モデル(LLM)は、チャットボットやライティングアシスタントなど … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR | Ignore This Title and HackAPrompt: Exposing Systemic Vulnerabilities of LLMs through a Global Scale Prompt Hacking Competition はコメントを受け付けていません

Mark My Words: Analyzing and Evaluating Language Model Watermarks

要約 近年、大規模な言語モデルの能力が著しく向上しており、その悪用に対する懸念も … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR | Mark My Words: Analyzing and Evaluating Language Model Watermarks はコメントを受け付けていません

FFT: Towards Harmlessness Evaluation and Analysis for LLMs with Factuality, Fairness, Toxicity

要約 生成人工知能の普及により、AI が生成したテキストによってもたらされる潜在 … 続きを読む

カテゴリー: cs.CL, cs.CR | FFT: Towards Harmlessness Evaluation and Analysis for LLMs with Factuality, Fairness, Toxicity はコメントを受け付けていません

Locally Differentially Private Document Generation Using Zero Shot Prompting

要約 多くの研究で、事前トレーニングされた大規模な言語モデルに関連するプライバシ … 続きを読む

カテゴリー: cs.CL, cs.CR, cs.LG | Locally Differentially Private Document Generation Using Zero Shot Prompting はコメントを受け付けていません

Improving the Robustness of Transformer-based Large Language Models with Dynamic Attention

要約 BERT や GPT などのトランスフォーマー ベースのモデルは、その優れ … 続きを読む

カテゴリー: cs.CL, cs.CR, cs.LG | Improving the Robustness of Transformer-based Large Language Models with Dynamic Attention はコメントを受け付けていません

Intellectual Property Protection of Diffusion Models via the Watermark Diffusion Process

要約 今日の需要の増大を考慮すると、拡散モデルは急速にディープジェネレーティブア … 続きを読む

カテゴリー: cs.CR, cs.LG | Intellectual Property Protection of Diffusion Models via the Watermark Diffusion Process はコメントを受け付けていません

BertRLFuzzer: A BERT and Reinforcement Learning based Fuzzer

要約 我々は、Web アプリケーションのセキュリティ脆弱性を発見することを目的と … 続きを読む

カテゴリー: cs.CR, cs.LG, cs.SE | BertRLFuzzer: A BERT and Reinforcement Learning based Fuzzer はコメントを受け付けていません