cs.GT」カテゴリーアーカイブ

The complexity of approximate (coarse) correlated equilibrium for incomplete information games

要約 不完全情報ゲームにおける近似相関平衡の分散学習の反復の複雑さを研究します。 … 続きを読む

カテゴリー: cs.AI, cs.DS, cs.GT, cs.LG | The complexity of approximate (coarse) correlated equilibrium for incomplete information games はコメントを受け付けていません

Pontryagin Neural Operator for Solving Parametric General-Sum Differential Games

要約 二人対戦の一般和微分ゲームの値は、ハミルトン-ヤコビ-アイザック(HJI) … 続きを読む

カテゴリー: cs.GT, cs.LG, cs.RO | Pontryagin Neural Operator for Solving Parametric General-Sum Differential Games はコメントを受け付けていません

Model-Based RL for Mean-Field Games is not Statistically Harder than Single-Agent RL

要約 本研究では、モデルベースの関数近似を用いた平均場ゲーム(MFG)における強 … 続きを読む

カテゴリー: cs.AI, cs.GT, cs.LG, stat.ML | Model-Based RL for Mean-Field Games is not Statistically Harder than Single-Agent RL はコメントを受け付けていません

Fusion-PSRO: Nash Policy Fusion for Policy Space Response Oracles

要約 ゼロサムゲームを解くための一般的なアプローチは、ナッシュ均衡(NE)を近似 … 続きを読む

カテゴリー: cs.AI, cs.GT, cs.LG, cs.MA | Fusion-PSRO: Nash Policy Fusion for Policy Space Response Oracles はコメントを受け付けていません

Stochastic Online Fisher Markets: Static Pricing Limits and Adaptive Enhancements

要約 漁場は資源配分の最も基本的なモデルの 1 つです。 しかし、フィッシャーマ … 続きを読む

カテゴリー: cs.GT, cs.LG, econ.TH, math.OC | Stochastic Online Fisher Markets: Static Pricing Limits and Adaptive Enhancements はコメントを受け付けていません

Fusion-PSRO: Nash Policy Fusion for Policy Space Response Oracles

要約 非推移性を伴うゼロサム ゲームを解決するための一般的なアプローチは、ナッシ … 続きを読む

カテゴリー: cs.AI, cs.GT, cs.LG, cs.MA | Fusion-PSRO: Nash Policy Fusion for Policy Space Response Oracles はコメントを受け付けていません

Eliciting Informative Text Evaluations with Large Language Models

要約 ピア予測メカニズムは、証明可能な保証を備えた高品質のフィードバックを動機付 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.GT | Eliciting Informative Text Evaluations with Large Language Models はコメントを受け付けていません

Policy Space Response Oracles: A Survey

要約 ゲーム理論は、複数の意思決定者間の相互作用を研究する数学的方法を提供します … 続きを読む

カテゴリー: cs.AI, cs.GT, cs.MA | Policy Space Response Oracles: A Survey はコメントを受け付けていません

Axioms for AI Alignment from Human Feedback

要約 ヒューマン フィードバックからの強化学習 (RLHF) のコンテキストでは … 続きを読む

カテゴリー: cs.AI, cs.GT, cs.LG | Axioms for AI Alignment from Human Feedback はコメントを受け付けていません

Strategy-Proof Auctions through Conformal Prediction

要約 オークションは、売り手の収益を最大化し、買い手間の誠実な入札を保証するため … 続きを読む

カテゴリー: cs.GT, cs.LG | Strategy-Proof Auctions through Conformal Prediction はコメントを受け付けていません