cs.CY」カテゴリーアーカイブ

Compromising Honesty and Harmlessness in Language Models via Deception Attacks

要約 大規模な言語モデル(LLMS)に関する最近の研究は、明示的な促進がなくても … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CY | コメントする

Evaluating the Performance of ChatGPT for Spam Email Detection

要約 電子メールは引き続き極めて重要であり、専門的および商業的なドメイン内でコミ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CY, cs.LG | コメントする

Utility Engineering: Analyzing and Controlling Emergent Value Systems in AIs

要約 AISが急速に前進し、よりエージェントになるにつれて、彼らが提起するリスク … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.CY, cs.LG | コメントする

SoK: A Classification for AI-driven Personalized Privacy Assistants

要約 ユーザーがプライバシー関連の意思決定を行うのを支援するために、AIテクノロ … 続きを読む

カテゴリー: cs.AI, cs.CY | コメントする

A Practical Method for Generating String Counterfactuals

要約 言語モデルの表現空間(LMS)を対象とした介入は、モデルの行動に影響を与え … 続きを読む

カテゴリー: cs.CL, cs.CY, cs.LG | コメントする

Human Decision-making is Susceptible to AI-driven Manipulation

要約 人工知能(AI)システムは、日常生活とますます絡み合っており、ユーザーがさ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CY, cs.HC | コメントする

SoK: A Classification for AI-driven Personalized Privacy Assistants

要約 ユーザーがプライバシー関連の意思決定を行うのを支援するために、AIテクノロ … 続きを読む

カテゴリー: cs.AI, cs.CY | コメントする

(Ir)rationality in AI: State of the Art, Research Challenges and Open Questions

要約 合理性の概念は、人工知能の分野の中心です。 私たちが人間の推論をシミュレー … 続きを読む

カテゴリー: cs.AI, cs.CY, cs.HC, cs.LG, cs.MA | コメントする

Breaking Down Bias: On The Limits of Generalizable Pruning Strategies

要約 モデル剪定を採用して、LLMSが人種バイアスをどのように概念化するか、およ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CY, cs.LG | コメントする

Economics of Sourcing Human Data

要約 AIの進歩は、アノテーター市場からより広いインターネットまで、人間で生成さ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.CY, cs.HC, cs.LG | コメントする