cs.CR」カテゴリーアーカイブ

SALAD-Bench: A Hierarchical and Comprehensive Safety Benchmark for Large Language Models

要約 大規模言語モデル (LLM) の急速に進化する状況では、堅牢な安全対策を確 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG | SALAD-Bench: A Hierarchical and Comprehensive Safety Benchmark for Large Language Models はコメントを受け付けていません

On Mitigating the Utility-Loss in Differentially Private Learning: A new Perspective by a Geometrically Inspired Kernel Approach

要約 プライバシーとユーティリティのトレードオフは、差分プライベート機械学習の基 … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.LG | On Mitigating the Utility-Loss in Differentially Private Learning: A new Perspective by a Geometrically Inspired Kernel Approach はコメントを受け付けていません

Universal Jailbreak Backdoors from Poisoned Human Feedback

要約 ヒューマン フィードバックからの強化学習 (RLHF) は、大規模な言語モ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG | Universal Jailbreak Backdoors from Poisoned Human Feedback はコメントを受け付けていません

SALAD-Bench: A Hierarchical and Comprehensive Safety Benchmark for Large Language Models

要約 大規模言語モデル (LLM) の急速に進化する状況では、堅牢な安全対策を確 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG | SALAD-Bench: A Hierarchical and Comprehensive Safety Benchmark for Large Language Models はコメントを受け付けていません

Defending Our Privacy With Backdoors

要約 厳選されていない、多くの場合機密性の高い Web スクレイピング データに … 続きを読む

カテゴリー: cs.CL, cs.CR, cs.CV, cs.LG | Defending Our Privacy With Backdoors はコメントを受け付けていません

Use of Multi-CNNs for Section Analysis in Static Malware Detection

要約 マルウェア検出に関する既存の研究は、ほぼ検出率のみに焦点を当てています。 … 続きを読む

カテゴリー: cs.AI, cs.CR | Use of Multi-CNNs for Section Analysis in Static Malware Detection はコメントを受け付けていません

COPS: A Compact On-device Pipeline for real-time Smishing detection

要約 スマートフォンは私たちの生活に欠かせないものとなり、コミュニケーションから … 続きを読む

カテゴリー: cs.AI, cs.CR | COPS: A Compact On-device Pipeline for real-time Smishing detection はコメントを受け付けていません

Multiclass Classification Procedure for Detecting Attacks on MQTT-IoT Protocol

要約 モノのインターネットを構成するセンサーやアクチュエーターの数が多いため、こ … 続きを読む

カテゴリー: cs.CR, cs.LG, I.2.0 | Multiclass Classification Procedure for Detecting Attacks on MQTT-IoT Protocol はコメントを受け付けていません

Conversation Reconstruction Attack Against GPT Models

要約 近年、GPTシリーズモデルに代表される大規模言語モデル(LLM)の分野で大 … 続きを読む

カテゴリー: cs.CL, cs.CR | Conversation Reconstruction Attack Against GPT Models はコメントを受け付けていません

Homograph Attacks on Maghreb Sentiment Analyzers

要約 北アフリカのマグレブ諸国の様々なアラビア語方言のセンチメント分析(SA)タ … 続きを読む

カテゴリー: cs.CL, cs.CR, cs.LG | Homograph Attacks on Maghreb Sentiment Analyzers はコメントを受け付けていません