cs.GT」カテゴリーアーカイブ

Iterative Nash Policy Optimization: Aligning LLMs with General Preferences via No-Regret Learning

要約 人間のフィードバックによる強化学習(RLHF)は、大規模な言語モデル(LL … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.GT, cs.LG | Iterative Nash Policy Optimization: Aligning LLMs with General Preferences via No-Regret Learning はコメントを受け付けていません

Re-evaluating Open-ended Evaluation of Large Language Models

要約 評価は、伝統的に特定のスキルの候補者のランキングに焦点を当ててきました。 … 続きを読む

カテゴリー: cs.CL, cs.GT, cs.LG, stat.ML | Re-evaluating Open-ended Evaluation of Large Language Models はコメントを受け付けていません

Mixing Any Cocktail with Limited Ingredients: On the Structure of Payoff Sets in Multi-Objective MDPs and its Impact on Randomised Strategies

要約 マルコフの決定プロセスにおける多次元ペイオフ関数を検討し、特定の予想ペイオ … 続きを読む

カテゴリー: cs.AI, cs.FL, cs.GT, cs.LO, math.PR | Mixing Any Cocktail with Limited Ingredients: On the Structure of Payoff Sets in Multi-Objective MDPs and its Impact on Randomised Strategies はコメントを受け付けていません

Adversaries With Incentives: A Strategic Alternative to Adversarial Robustness

要約 敵対的な訓練は、 *敵対者 *を防御することを目的としています。その唯一の … 続きを読む

カテゴリー: cs.GT, cs.LG | Adversaries With Incentives: A Strategic Alternative to Adversarial Robustness はコメントを受け付けていません

An Adversarial Analysis of Thompson Sampling for Full-information Online Learning: from Finite to Infinite Action Spaces

要約 専門家の空間ではなく、敵の将来の行動の空間で学習者の事前が定義されている場 … 続きを読む

カテゴリー: cs.GT, cs.LG, math.ST, stat.ML, stat.TH | An Adversarial Analysis of Thompson Sampling for Full-information Online Learning: from Finite to Infinite Action Spaces はコメントを受け付けていません

An Adversarial Analysis of Thompson Sampling for Full-information Online Learning: from Finite to Infinite Action Spaces

要約 専門家の空間ではなく、敵の将来の行動の空間で学習者の事前が定義されている場 … 続きを読む

カテゴリー: cs.GT, cs.LG, math.ST, stat.ML, stat.TH | An Adversarial Analysis of Thompson Sampling for Full-information Online Learning: from Finite to Infinite Action Spaces はコメントを受け付けていません

Human Misperception of Generative-AI Alignment: A Laboratory Experiment

要約 私たちは、経済的意思決定の文脈において、生成的人工知能(GENAI)のアラ … 続きを読む

カテゴリー: cs.AI, cs.GT, econ.TH | Human Misperception of Generative-AI Alignment: A Laboratory Experiment はコメントを受け付けていません

AI-Assisted Decision Making with Human Learning

要約 AIシステムは、人間の意思決定をますますサポートしています。 多くの場合、 … 続きを読む

カテゴリー: cs.AI, cs.GT, cs.HC | AI-Assisted Decision Making with Human Learning はコメントを受け付けていません

A Multiagent Path Search Algorithm for Large-Scale Coalition Structure Generation

要約 連合構造生成(CSG)、つまり、エージェントのセットを連合に最適に分割して … 続きを読む

カテゴリー: 68T01, 93A16, cs.AI, cs.GT, cs.MA, F.2 | A Multiagent Path Search Algorithm for Large-Scale Coalition Structure Generation はコメントを受け付けていません

Reinforcement Learning in Strategy-Based and Atari Games: A Review of Google DeepMinds Innovations

要約 Rehnection Learning(RL)は、AIモデルの優れたトレー … 続きを読む

カテゴリー: cs.AI, cs.GT | Reinforcement Learning in Strategy-Based and Atari Games: A Review of Google DeepMinds Innovations はコメントを受け付けていません