-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CR」カテゴリーアーカイブ
Improving LLM Safety Alignment with Dual-Objective Optimization
要約 大規模な言語モデル(LLM)の既存のトレーニング時間安全アライメント手法は … 続きを読む
Monitoring Decomposition Attacks in LLMs with Lightweight Sequential Monitors
要約 現在のLLM安全防御は、拒否を回避する悪意のある目標が良性サブタスクに分解 … 続きを読む
ChineseHarm-Bench: A Chinese Harmful Content Detection Benchmark
要約 大規模な言語モデル(LLM)は、自動化された有害なコンテンツ検出タスクにま … 続きを読む
SoK: Watermarking for AI-Generated Content
要約 生成AI(genai)技術の出力が品質が向上するにつれて、それらを人間が作 … 続きを読む
Unsourced Adversarial CAPTCHA: A Bi-Phase Adversarial CAPTCHA Framework
要約 深い学習の急速な進歩により、従来のキャプチャスキームは、深いニューラルネッ … 続きを読む
Generate-then-Verify: Reconstructing Data from Limited Published Statistics
要約 集計統計から表形式データを再構築する問題を研究します。攻撃者は、集合体を考 … 続きを読む
One Pic is All it Takes: Poisoning Visual Document Retrieval Augmented Generation with a Single Image
要約 マルチモーダル検索拡張生成(M-RAG)は、事実知識ベース(KB)を使用し … 続きを読む
LLMail-Inject: A Dataset from a Realistic Adaptive Prompt Injection Challenge
要約 間接的な迅速な噴射攻撃は、入力の命令とデータを区別するために、大規模な言語 … 続きを読む
Trustworthy AI: Safety, Bias, and Privacy — A Survey
要約 人工知能システムの能力は大幅に進歩していますが、これらのシステムは依然とし … 続きを読む
Provably Cost-Sensitive Adversarial Defense via Randomized Smoothing
要約 MLモデルは重要なアプリケーションでますます展開されているため、敵対的な摂 … 続きを読む