cs.GT」カテゴリーアーカイブ

Combining Deep Reinforcement Learning and Search with Generative Models for Game-Theoretic Opponent Modeling

要約 対戦相手のモデリング方法には、通常、2つの重要な手順が含まれます。対戦相手 … 続きを読む

カテゴリー: cs.AI, cs.GT, cs.LG, cs.MA | コメントする

Adaptive Discretization against an Adversary: Lipschitz bandits, Dynamic Pricing, and Auction Tuning

要約 Lipschitz Banditsは、$ [0,1] $間隔などの大きく構 … 続きを読む

カテゴリー: cs.DS, cs.GT, cs.LG, stat.ML | コメントする

Diffusion of Responsibility in Collective Decision Making

要約 「責任の拡散」という用語は、複数のエージェントが結果に対する責任を共有し、 … 続きを読む

カテゴリー: cs.AI, cs.GT, cs.MA | コメントする

Beyond Winning Strategies: Admissible and Admissible Winning Strategies for Quantitative Reachability Games

要約 古典的な反応性合成アプローチは、特定の仕様を常に満たすリアクティブシステム … 続きを読む

カテゴリー: cs.FL, cs.GT, cs.LO, cs.RO, D.2.4 | コメントする

Microgrids Coalitions for Energy Market Balancing

要約 電力流通ネットワークに再生可能なソースが統合されると、エネルギー市場のバラ … 続きを読む

カテゴリー: cs.AI, cs.GT | コメントする

Conservative classifiers do consistently well with improving agents: characterizing statistical and online learning

要約 機械学習は、たとえば、求職者やローン申請の評価において、社会的意思決定にお … 続きを読む

カテゴリー: cs.GT, cs.LG, cs.MA | コメントする

PAC Learning with Improvements

要約 機械学習における最も基本的な下界の一つは、ほぼ全ての非自明な設定において、 … 続きを読む

カテゴリー: cs.GT, cs.LG, stat.ML | コメントする

Designing Algorithmic Delegates: The Role of Indistinguishability in Human-AI Handoff

要約 AI技術の進歩に伴い、人々はAIエージェントに仕事を任せることを望むように … 続きを読む

カテゴリー: cs.AI, cs.CY, cs.GT | コメントする

Distortion of AI Alignment: Does Preference Optimization Optimize for Preferences?

要約 トレーニング前の後、大規模な言語モデルは、ペアワイズ比較に基づいて人間の好 … 続きを読む

カテゴリー: cs.GT, cs.LG | Distortion of AI Alignment: Does Preference Optimization Optimize for Preferences? はコメントを受け付けていません

Learned Collusion

要約 Qラーニングは、利用可能な各アクションに関連付けられた継続値の推定値(Q値 … 続きを読む

カテゴリー: cs.AI, cs.GT, econ.TH | Learned Collusion はコメントを受け付けていません