cs.GT」カテゴリーアーカイブ

State-Constrained Zero-Sum Differential Games with One-Sided Information

要約 私たちは、状態制約と一方的な情報を備えたゼロサム差分ゲームを研究します。こ … 続きを読む

カテゴリー: cs.GT, cs.LG | State-Constrained Zero-Sum Differential Games with One-Sided Information はコメントを受け付けていません

Social Choice Should Guide AI Alignment in Dealing with Diverse Human Feedback

要約 GPT-4 などの財団モデルは、犯罪の幇助や人種差別的なテキストの作成など … 続きを読む

カテゴリー: 68T01, 68T50, 91B12, 91B14, cs.AI, cs.CL, cs.CY, cs.GT, cs.LG, I.2.0 | Social Choice Should Guide AI Alignment in Dealing with Diverse Human Feedback はコメントを受け付けていません

The complexity of approximate (coarse) correlated equilibrium for incomplete information games

要約 不完全情報ゲームにおける近似相関平衡の分散学習の反復の複雑さを研究します。 … 続きを読む

カテゴリー: cs.AI, cs.DS, cs.GT, cs.LG | The complexity of approximate (coarse) correlated equilibrium for incomplete information games はコメントを受け付けていません

Pontryagin Neural Operator for Solving Parametric General-Sum Differential Games

要約 二人対戦の一般和微分ゲームの値は、ハミルトン-ヤコビ-アイザック(HJI) … 続きを読む

カテゴリー: cs.GT, cs.LG, cs.RO | Pontryagin Neural Operator for Solving Parametric General-Sum Differential Games はコメントを受け付けていません

Model-Based RL for Mean-Field Games is not Statistically Harder than Single-Agent RL

要約 本研究では、モデルベースの関数近似を用いた平均場ゲーム(MFG)における強 … 続きを読む

カテゴリー: cs.AI, cs.GT, cs.LG, stat.ML | Model-Based RL for Mean-Field Games is not Statistically Harder than Single-Agent RL はコメントを受け付けていません

Fusion-PSRO: Nash Policy Fusion for Policy Space Response Oracles

要約 ゼロサムゲームを解くための一般的なアプローチは、ナッシュ均衡(NE)を近似 … 続きを読む

カテゴリー: cs.AI, cs.GT, cs.LG, cs.MA | Fusion-PSRO: Nash Policy Fusion for Policy Space Response Oracles はコメントを受け付けていません

Stochastic Online Fisher Markets: Static Pricing Limits and Adaptive Enhancements

要約 漁場は資源配分の最も基本的なモデルの 1 つです。 しかし、フィッシャーマ … 続きを読む

カテゴリー: cs.GT, cs.LG, econ.TH, math.OC | Stochastic Online Fisher Markets: Static Pricing Limits and Adaptive Enhancements はコメントを受け付けていません

Fusion-PSRO: Nash Policy Fusion for Policy Space Response Oracles

要約 非推移性を伴うゼロサム ゲームを解決するための一般的なアプローチは、ナッシ … 続きを読む

カテゴリー: cs.AI, cs.GT, cs.LG, cs.MA | Fusion-PSRO: Nash Policy Fusion for Policy Space Response Oracles はコメントを受け付けていません

Eliciting Informative Text Evaluations with Large Language Models

要約 ピア予測メカニズムは、証明可能な保証を備えた高品質のフィードバックを動機付 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.GT | Eliciting Informative Text Evaluations with Large Language Models はコメントを受け付けていません

Policy Space Response Oracles: A Survey

要約 ゲーム理論は、複数の意思決定者間の相互作用を研究する数学的方法を提供します … 続きを読む

カテゴリー: cs.AI, cs.GT, cs.MA | Policy Space Response Oracles: A Survey はコメントを受け付けていません