cs.CR」カテゴリーアーカイブ

Input Reconstruction Attack against Vertical Federated Large Language Models

要約 最近、ChatGPT の出現により、大規模言語モデル (LLM) が学界や … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR | Input Reconstruction Attack against Vertical Federated Large Language Models はコメントを受け付けていません

Universal Jailbreak Backdoors from Poisoned Human Feedback

要約 ヒューマン フィードバックからの強化学習 (RLHF) は、大規模な言語モ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG | Universal Jailbreak Backdoors from Poisoned Human Feedback はコメントを受け付けていません

FRAD: Front-Running Attacks Detection on Ethereum using Ternary Classification Model

要約 ブロックチェーン技術の進化に伴い、特にイーサリアムなどのプラットフォームに … 続きを読む

カテゴリー: cs.AI, cs.CR | FRAD: Front-Running Attacks Detection on Ethereum using Ternary Classification Model はコメントを受け付けていません

Backdoor Activation Attack: Attack Large Language Models using Activation Steering for Safety-Alignment

要約 AI の安全性を確保するために、命令調整されたラージ言語モデル (LLM) … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR | Backdoor Activation Attack: Attack Large Language Models using Activation Steering for Safety-Alignment はコメントを受け付けていません

Segment (Almost) Nothing: Prompt-Agnostic Adversarial Attacks on Segmentation Models

要約 汎用セグメンテーション モデルは、視覚的なプロンプト (点、ボックスなど) … 続きを読む

カテゴリー: cs.CR, cs.CV, cs.LG | Segment (Almost) Nothing: Prompt-Agnostic Adversarial Attacks on Segmentation Models はコメントを受け付けていません

Transfer Attacks and Defenses for Large Language Models on Coding Tasks

要約 ChatGPT などの最新の大規模言語モデル (LLM) は、コードの記述 … 続きを読む

カテゴリー: cs.CR, cs.LG | Transfer Attacks and Defenses for Large Language Models on Coding Tasks はコメントを受け付けていません

Differentially Private Non-Convex Optimization under the KL Condition with Optimal Rates

要約 $(\gamma,\kappa)$-Kurdyka-{\L}ojasiew … 続きを読む

カテゴリー: cs.CR, cs.LG, math.OC, stat.ML | Differentially Private Non-Convex Optimization under the KL Condition with Optimal Rates はコメントを受け付けていません

Explaining high-dimensional text classifiers

要約 説明可能性はここ数年で貴重なツールとなり、人間が AI に基づいた意思決定 … 続きを読む

カテゴリー: cs.CR, cs.LG, cs.NE, stat.ML | Explaining high-dimensional text classifiers はコメントを受け付けていません

A Survey of Adversarial CAPTCHAs on its History, Classification and Generation

要約 コンピュータと人間を区別するための完全に自動化された公開チューリング テス … 続きを読む

カテゴリー: cs.AI, cs.CR | A Survey of Adversarial CAPTCHAs on its History, Classification and Generation はコメントを受け付けていません

From Principle to Practice: Vertical Data Minimization for Machine Learning

要約 予測モデルのトレーニングと展開を目的として、組織は大量の詳細な顧客データを … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.LG | From Principle to Practice: Vertical Data Minimization for Machine Learning はコメントを受け付けていません