cs.GT」カテゴリーアーカイブ

AlphaDou: High-Performance End-to-End Doudizhu AI Integrating Bidding

要約 カード ゲーム用の人工知能は、AI 研究において長い間人気のトピックでした … 続きを読む

カテゴリー: cs.AI, cs.GT, cs.MA | AlphaDou: High-Performance End-to-End Doudizhu AI Integrating Bidding はコメントを受け付けていません

Policy Optimization finds Nash Equilibrium in Regularized General-Sum LQ Games

要約 この論文では、General-Sum $N$-agent ゲームのナッシュ … 続きを読む

カテゴリー: cs.AI, cs.GT, cs.LG, cs.MA | Policy Optimization finds Nash Equilibrium in Regularized General-Sum LQ Games はコメントを受け付けていません

Multi-Robot Coordination Induced in Hazardous Environments through an Adversarial Graph-Traversal Game

要約 この論文では、軍事およびセキュリティ用途など、敵が存在する危険な環境を移動 … 続きを読む

カテゴリー: cs.GT, cs.RO | Multi-Robot Coordination Induced in Hazardous Environments through an Adversarial Graph-Traversal Game はコメントを受け付けていません

Rethinking Teacher-Student Curriculum Learning through the Cooperative Mechanics of Experience

要約 Teacher-Student Curriculum Learning ( … 続きを読む

カテゴリー: cs.AI, cs.GT, cs.LG | Rethinking Teacher-Student Curriculum Learning through the Cooperative Mechanics of Experience はコメントを受け付けていません

Cyber Deception: State of the art, Trends and Open challenges

要約 サイバーセキュリティへの関心の高まりにより、さまざまなサイバー デセプショ … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.GT | Cyber Deception: State of the art, Trends and Open challenges はコメントを受け付けていません

Indirect Dynamic Negotiation in the Nash Demand Game

要約 この論文は、不完全な情報による逐次二国間交渉の問題を扱っています。 私たち … 続きを読む

カテゴリー: cs.AI, cs.GT, math.OC | Indirect Dynamic Negotiation in the Nash Demand Game はコメントを受け付けていません

Partially Observable Multi-Agent Reinforcement Learning with Information Sharing

要約 私たちは、部分的に観測可能な確率的ゲーム (POSG) の一般的な枠組みで … 続きを読む

カテゴリー: cs.GT, cs.LG, cs.MA | Partially Observable Multi-Agent Reinforcement Learning with Information Sharing はコメントを受け付けていません

Multi-Agent Reinforcement Learning from Human Feedback: Data Coverage and Algorithmic Techniques

要約 私たちは、ヒューマン フィードバックからのマルチエージェント強化学習 (M … 続きを読む

カテゴリー: cs.AI, cs.GT, cs.LG, cs.MA | Multi-Agent Reinforcement Learning from Human Feedback: Data Coverage and Algorithmic Techniques はコメントを受け付けていません

Eliciting Informative Text Evaluations with Large Language Models

要約 ピア予測メカニズムは、証明可能な保証を持つ高品質のフィードバックを動機づけ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.GT | Eliciting Informative Text Evaluations with Large Language Models はコメントを受け付けていません

Exploiting Approximate Symmetry for Efficient Multi-Agent Reinforcement Learning

要約 平均場ゲーム (MFG) は、対称性の下での大規模なマルチエージェント強化 … 続きを読む

カテゴリー: cs.GT, cs.LG, math.OC, stat.ML | Exploiting Approximate Symmetry for Efficient Multi-Agent Reinforcement Learning はコメントを受け付けていません