cs.GT」カテゴリーアーカイブ

Optimistic Policy Gradient in Multi-Player Markov Games with a Single Controller: Convergence Beyond the Minty Property

要約 ポリシー勾配法は、強化学習の多くのタスクで実用的な優れたパフォーマンスを発 … 続きを読む

カテゴリー: cs.GT, cs.LG | Optimistic Policy Gradient in Multi-Player Markov Games with a Single Controller: Convergence Beyond the Minty Property はコメントを受け付けていません

Are ChatGPT and GPT-4 Good Poker Players? — A Pre-Flop Analysis

要約 ChatGPT と GPT-4 の導入以来、これらのモデルは多数のタスクに … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.GT | Are ChatGPT and GPT-4 Good Poker Players? — A Pre-Flop Analysis はコメントを受け付けていません

Finding Nash equilibria by minimizing approximate exploitability with learned best responses

要約 ゲーム理論の均衡を見つけることに関しては、かなりの進歩が見られました。 そ … 続きを読む

カテゴリー: cs.AI, cs.GT, cs.LG, cs.MA | Finding Nash equilibria by minimizing approximate exploitability with learned best responses はコメントを受け付けていません

Nonparametric Strategy Test

要約 我々は、エージェントのプレイのサンプルが与えられた場合に、エージェントが反 … 続きを読む

カテゴリー: cs.AI, cs.GT, cs.MA, econ.TH, stat.ME | Nonparametric Strategy Test はコメントを受け付けていません

Sequential Principal-Agent Problems with Communication: Efficient Computation and Learning

要約 私たちは、双方の不完全な情報を持つプリンシパルとエージェントの間の逐次的意 … 続きを読む

カテゴリー: cs.GT, cs.LG, cs.MA | Sequential Principal-Agent Problems with Communication: Efficient Computation and Learning はコメントを受け付けていません

Price-Discrimination Game for Distributed Resource Management in Federated Learning

要約 FedAvg などの標準的なフェデレーテッド ラーニング (FL) では、 … 続きを読む

カテゴリー: cs.GT, cs.LG | Price-Discrimination Game for Distributed Resource Management in Federated Learning はコメントを受け付けていません

Learning Discrete-Time Major-Minor Mean Field Games

要約 Mean Field Games (MFG) に基づく最近の技術により、多 … 続きを読む

カテゴリー: cs.GT, cs.LG, cs.MA, math.OC | Learning Discrete-Time Major-Minor Mean Field Games はコメントを受け付けていません

Nonparametric Strategy Test

要約 我々は、エージェントのプレイのサンプルが与えられた場合に、エージェントが反 … 続きを読む

カテゴリー: cs.AI, cs.GT, cs.MA, econ.TH, stat.ME | Nonparametric Strategy Test はコメントを受け付けていません

Learning in Online Principle-Agent Interactions: The Power of Menus

要約 私たちは、オンラインのプリンシパル-エージェント問題におけるユビキタスな学 … 続きを読む

カテゴリー: cs.GT, cs.LG | Learning in Online Principle-Agent Interactions: The Power of Menus はコメントを受け付けていません

A Game-theoretic Framework for Privacy-preserving Federated Learning

要約 フェデレーテッド ラーニングでは、良性の参加者が協力してグローバル モデル … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.GT, cs.LG | A Game-theoretic Framework for Privacy-preserving Federated Learning はコメントを受け付けていません