cs.GT」カテゴリーアーカイブ

Multi-Agent Reinforcement Learning from Human Feedback: Data Coverage and Algorithmic Techniques

要約 私たちは、ヒューマン フィードバックからのマルチエージェント強化学習 (M … 続きを読む

カテゴリー: cs.AI, cs.GT, cs.LG, cs.MA | Multi-Agent Reinforcement Learning from Human Feedback: Data Coverage and Algorithmic Techniques はコメントを受け付けていません

Eliciting Informative Text Evaluations with Large Language Models

要約 ピア予測メカニズムは、証明可能な保証を持つ高品質のフィードバックを動機づけ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.GT | Eliciting Informative Text Evaluations with Large Language Models はコメントを受け付けていません

Exploiting Approximate Symmetry for Efficient Multi-Agent Reinforcement Learning

要約 平均場ゲーム (MFG) は、対称性の下での大規模なマルチエージェント強化 … 続きを読む

カテゴリー: cs.GT, cs.LG, math.OC, stat.ML | Exploiting Approximate Symmetry for Efficient Multi-Agent Reinforcement Learning はコメントを受け付けていません

Beyond Winning Strategies: Admissible and Admissible Winning Strategies for Quantitative Reachability Games

要約 古典的な反応性合成アプローチは、常に指定された仕様を満たす反応性システムを … 続きを読む

カテゴリー: cs.FL, cs.GT, cs.LO, cs.RO, D.2.4 | Beyond Winning Strategies: Admissible and Admissible Winning Strategies for Quantitative Reachability Games はコメントを受け付けていません

Networked Communication for Mean-Field Games with Function Approximation and Empirical Mean-Field Estimation

要約 最近の研究では、通信ネットワークを介して接続されている分散エージェントが、 … 続きを読む

カテゴリー: cs.AI, cs.GT, cs.LG, cs.MA, cs.SY, eess.SY | Networked Communication for Mean-Field Games with Function Approximation and Empirical Mean-Field Estimation はコメントを受け付けていません

Multiwinner Temporal Voting with Aversion to Change

要約 私たちは、有権者が候補者に対して動的な好みを持っている 2 段階の委員会選 … 続きを読む

カテゴリー: cs.AI, cs.CC, cs.GT | Multiwinner Temporal Voting with Aversion to Change はコメントを受け付けていません

Conjectural Online Learning with First-order Beliefs in Asymmetric Information Stochastic Games

要約 非対称情報確率ゲーム (AISG) は、サイバー物理システムや IT イン … 続きを読む

カテゴリー: cs.GT, cs.LG, cs.SY, eess.SY | Conjectural Online Learning with First-order Beliefs in Asymmetric Information Stochastic Games はコメントを受け付けていません

Synthesis of Reward Machines for Multi-Agent Equilibrium Design (Full Version)

要約 メカニズムの設計は、望ましい結果を達成するためにゲームを設計するための確立 … 続きを読む

カテゴリー: cs.AI, cs.GT, cs.MA | Synthesis of Reward Machines for Multi-Agent Equilibrium Design (Full Version) はコメントを受け付けていません

No Screening is More Efficient with Multiple Objects

要約 複数の異種オブジェクトを配置するための効率的な機構設計を研究します。 私た … 続きを読む

カテゴリー: cs.AI, cs.GT, cs.LG, econ.TH | No Screening is More Efficient with Multiple Objects はコメントを受け付けていません

Stochastic Semi-Gradient Descent for Learning Mean Field Games with Population-Aware Function Approximation

要約 平均フィールド ゲーム (MFG) は、人口分布を使用して大規模な人口のマ … 続きを読む

カテゴリー: cs.GT, cs.LG, cs.MA, math.OC | Stochastic Semi-Gradient Descent for Learning Mean Field Games with Population-Aware Function Approximation はコメントを受け付けていません