cs.GT」カテゴリーアーカイブ

Last-Iterate Convergence Properties of Regret-Matching Algorithms in Games

要約 リグレス マッチング、具体的にはリグレス マッチング $^+$ (RM$^ … 続きを読む

カテゴリー: cs.GT, cs.LG | Last-Iterate Convergence Properties of Regret-Matching Algorithms in Games はコメントを受け付けていません

Minimally Modifying a Markov Game to Achieve Any Nash Equilibrium and Value

要約 私たちは、善意のゲーム設計者または悪意のある敵対者が、ターゲットの決定論的 … 続きを読む

カテゴリー: cs.AI, cs.GT | Minimally Modifying a Markov Game to Achieve Any Nash Equilibrium and Value はコメントを受け付けていません

From External to Swap Regret 2.0: An Efficient Reduction and Oblivious Adversary for Large Action Spaces

要約 我々は、スワップ・リグレット最小化から外部リグレット最小化への新しい削減を … 続きを読む

カテゴリー: cs.AI, cs.GT, cs.LG | From External to Swap Regret 2.0: An Efficient Reduction and Oblivious Adversary for Large Action Spaces はコメントを受け付けていません

Learning Zero-Sum Linear Quadratic Games with Improved Sample Complexity and Last-Iterate Convergence

要約 ゼロサム線形二次 (LQ) ゲームは最適制御の基礎であり、(i) リスクに … 続きを読む

カテゴリー: cs.GT, cs.LG, cs.SY, eess.SY | Learning Zero-Sum Linear Quadratic Games with Improved Sample Complexity and Last-Iterate Convergence はコメントを受け付けていません

Learning in Zero-Sum Linear Quadratic Games with Last-Iterate Convergence

要約 ゼロサム線形二次 (LQ) ゲームは最適制御の基礎であり、(i) リスクに … 続きを読む

カテゴリー: cs.GT, cs.LG, cs.SY, eess.SY | Learning in Zero-Sum Linear Quadratic Games with Last-Iterate Convergence はコメントを受け付けていません

From Stream to Pool: Dynamic Pricing Beyond i.i.d. Arrivals

要約 動的価格設定の問題は、 \textbf{stream} モデルに基づいて広 … 続きを読む

カテゴリー: cs.GT, cs.LG | From Stream to Pool: Dynamic Pricing Beyond i.i.d. Arrivals はコメントを受け付けていません

Web3 Meets AI Marketplace: Exploring Opportunities, Analyzing Challenges, and Suggesting Solutions

要約 Web3 と AI はここ数年で最も議論されている分野の 1 つであり、私 … 続きを読む

カテゴリー: cs.AI, cs.CE, cs.CR, cs.GT, cs.NI | Web3 Meets AI Marketplace: Exploring Opportunities, Analyzing Challenges, and Suggesting Solutions はコメントを受け付けていません

Learning Regularized Graphon Mean-Field Games with Unknown Graphons

要約 私たちは、グラフン平均場ゲーム (GMFG) の強化学習アルゴリズムを設計 … 続きを読む

カテゴリー: cs.GT, cs.LG, stat.ML | Learning Regularized Graphon Mean-Field Games with Unknown Graphons はコメントを受け付けていません

Optimal Scoring Rule Design under Partial Knowledge

要約 この論文では、プリンシパルがエージェントの信号分布について部分的な知識を持 … 続きを読む

カテゴリー: cs.GT, cs.LG, math.ST, stat.TH | Optimal Scoring Rule Design under Partial Knowledge はコメントを受け付けていません

Maximize to Explore: One Objective Function Fusing Estimation, Planning, and Exploration

要約 オンライン強化学習 (オンライン RL) では、サンプル効率の高い方法で最 … 続きを読む

カテゴリー: cs.AI, cs.GT, cs.LG, math.OC, stat.ML | Maximize to Explore: One Objective Function Fusing Estimation, Planning, and Exploration はコメントを受け付けていません