cs.GT」カテゴリーアーカイブ

HiBid: A Cross-Channel Constrained Bidding System with Budget Allocation by Hierarchical Offline Deep Reinforcement Learning

要約 オンライン ディスプレイ広告プラットフォームは、毎日数十億件規模の広告リク … 続きを読む

カテゴリー: cs.GT, cs.LG | HiBid: A Cross-Channel Constrained Bidding System with Budget Allocation by Hierarchical Offline Deep Reinforcement Learning はコメントを受け付けていません

User Strategization and Trustworthy Algorithms

要約 人間向けのアルゴリズムの多くは、推奨システムや採用決定ツールを強化するもの … 続きを読む

カテゴリー: cs.CY, cs.GT, cs.LG, stat.ML | User Strategization and Trustworthy Algorithms はコメントを受け付けていません

Replication-proof Bandit Mechanism Design

要約 私たちは、エージェントが利益を最大化するために自分の武器を戦略的に登録また … 続きを読む

カテゴリー: cs.AI, cs.DS, cs.GT | Replication-proof Bandit Mechanism Design はコメントを受け付けていません

Leading the Pack: N-player Opponent Shaping

要約 強化学習ソリューションは、2 プレーヤーの一般的な合計設定で大きな成功を収 … 続きを読む

カテゴリー: cs.GT, cs.LG, cs.MA | Leading the Pack: N-player Opponent Shaping はコメントを受け付けていません

Multiplayer Homicidal Chauffeur Reach-Avoid Games: A Pursuit Enclosure Function Approach

要約 この論文では、デュビン車の追跡者とシンプルモーションの回避者が関与する、マ … 続きを読む

カテゴリー: cs.GT, cs.RO, cs.SY, eess.SY | Multiplayer Homicidal Chauffeur Reach-Avoid Games: A Pursuit Enclosure Function Approach はコメントを受け付けていません

Gerrymandering Planar Graphs

要約 地図再区画問題 (ゲリマンダリング) の計算の複雑さを研究します。 数学的 … 続きを読む

カテゴリー: cs.AI, cs.DS, cs.GT | Gerrymandering Planar Graphs はコメントを受け付けていません

Strategyproof Decision-Making in Panel Data Settings and Beyond

要約 意思決定者が複数のユニット (またはエージェント) の測定を繰り返してノイ … 続きを読む

カテゴリー: cs.GT, cs.LG, econ.EM | Strategyproof Decision-Making in Panel Data Settings and Beyond はコメントを受け付けていません

Optimistic Policy Gradient in Multi-Player Markov Games with a Single Controller: Convergence Beyond the Minty Property

要約 ポリシー勾配法は、強化学習の多くのタスクで実用的な優れたパフォーマンスを発 … 続きを読む

カテゴリー: cs.GT, cs.LG | Optimistic Policy Gradient in Multi-Player Markov Games with a Single Controller: Convergence Beyond the Minty Property はコメントを受け付けていません

Are ChatGPT and GPT-4 Good Poker Players? — A Pre-Flop Analysis

要約 ChatGPT と GPT-4 の導入以来、これらのモデルは多数のタスクに … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.GT | Are ChatGPT and GPT-4 Good Poker Players? — A Pre-Flop Analysis はコメントを受け付けていません

Finding Nash equilibria by minimizing approximate exploitability with learned best responses

要約 ゲーム理論の均衡を見つけることに関しては、かなりの進歩が見られました。 そ … 続きを読む

カテゴリー: cs.AI, cs.GT, cs.LG, cs.MA | Finding Nash equilibria by minimizing approximate exploitability with learned best responses はコメントを受け付けていません