cs.CY」カテゴリーアーカイブ

Utility Engineering: Analyzing and Controlling Emergent Value Systems in AIs

要約 AISが急速に前進し、よりエージェントになるにつれて、彼らが提起するリスク … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.CY, cs.LG | Utility Engineering: Analyzing and Controlling Emergent Value Systems in AIs はコメントを受け付けていません

SoK: A Classification for AI-driven Personalized Privacy Assistants

要約 ユーザーがプライバシー関連の意思決定を行うのを支援するために、AIテクノロ … 続きを読む

カテゴリー: cs.AI, cs.CY | SoK: A Classification for AI-driven Personalized Privacy Assistants はコメントを受け付けていません

A Practical Method for Generating String Counterfactuals

要約 言語モデルの表現空間(LMS)を対象とした介入は、モデルの行動に影響を与え … 続きを読む

カテゴリー: cs.CL, cs.CY, cs.LG | A Practical Method for Generating String Counterfactuals はコメントを受け付けていません

Human Decision-making is Susceptible to AI-driven Manipulation

要約 人工知能(AI)システムは、日常生活とますます絡み合っており、ユーザーがさ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CY, cs.HC | Human Decision-making is Susceptible to AI-driven Manipulation はコメントを受け付けていません

SoK: A Classification for AI-driven Personalized Privacy Assistants

要約 ユーザーがプライバシー関連の意思決定を行うのを支援するために、AIテクノロ … 続きを読む

カテゴリー: cs.AI, cs.CY | SoK: A Classification for AI-driven Personalized Privacy Assistants はコメントを受け付けていません

(Ir)rationality in AI: State of the Art, Research Challenges and Open Questions

要約 合理性の概念は、人工知能の分野の中心です。 私たちが人間の推論をシミュレー … 続きを読む

カテゴリー: cs.AI, cs.CY, cs.HC, cs.LG, cs.MA | (Ir)rationality in AI: State of the Art, Research Challenges and Open Questions はコメントを受け付けていません

Breaking Down Bias: On The Limits of Generalizable Pruning Strategies

要約 モデル剪定を採用して、LLMSが人種バイアスをどのように概念化するか、およ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CY, cs.LG | Breaking Down Bias: On The Limits of Generalizable Pruning Strategies はコメントを受け付けていません

Economics of Sourcing Human Data

要約 AIの進歩は、アノテーター市場からより広いインターネットまで、人間で生成さ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.CY, cs.HC, cs.LG | Economics of Sourcing Human Data はコメントを受け付けていません

POEX: Understanding and Mitigating Policy Executable Jailbreak Attacks against Embodied AI

要約 具体化されたAIシステムは、LLMが計画モジュールとして統合されているため … 続きを読む

カテゴリー: cs.AI, cs.CY, cs.RO | POEX: Understanding and Mitigating Policy Executable Jailbreak Attacks against Embodied AI はコメントを受け付けていません

Incentivizing Desirable Effort Profiles in Strategic Classification: The Role of Causality and Uncertainty

要約 エージェントが分類の結果を改善するために機能を変更できるバイナリ意思決定設 … 続きを読む

カテゴリー: cs.CY, cs.GT, cs.LG | Incentivizing Desirable Effort Profiles in Strategic Classification: The Role of Causality and Uncertainty はコメントを受け付けていません