-
最近の投稿
- Topological mapping for traversability-aware long-range navigation in off-road terrain
- Equality Constrained Diffusion for Direct Trajectory Optimization
- Learning-Based Autonomous Navigation, Benchmark Environments and Simulation Framework for Endovascular Interventions
- Language Supervised Human Action Recognition with Salient Fusion: Construction Worker Action Recognition as a Use Case
- Bi-Level Motion Imitation for Humanoid Robots
-
最近のコメント
表示できるコメントはありません。 cs.AI (27641) cs.CL (20879) cs.CR (2167) cs.CV (34375) cs.LG (32373) cs.RO (15816) cs.SY (2460) eess.IV (4221) eess.SY (2454) stat.ML (4339)
「cs.GT」カテゴリーアーカイブ
Replication-proof Bandit Mechanism Design
要約 私たちは、エージェントが利益を最大化するために自分の武器を戦略的に登録また … 続きを読む
Leading the Pack: N-player Opponent Shaping
要約 強化学習ソリューションは、2 プレーヤーの一般的な合計設定で大きな成功を収 … 続きを読む
Multiplayer Homicidal Chauffeur Reach-Avoid Games: A Pursuit Enclosure Function Approach
要約 この論文では、デュビン車の追跡者とシンプルモーションの回避者が関与する、マ … 続きを読む
Gerrymandering Planar Graphs
要約 地図再区画問題 (ゲリマンダリング) の計算の複雑さを研究します。 数学的 … 続きを読む
Strategyproof Decision-Making in Panel Data Settings and Beyond
要約 意思決定者が複数のユニット (またはエージェント) の測定を繰り返してノイ … 続きを読む
Optimistic Policy Gradient in Multi-Player Markov Games with a Single Controller: Convergence Beyond the Minty Property
要約 ポリシー勾配法は、強化学習の多くのタスクで実用的な優れたパフォーマンスを発 … 続きを読む
Are ChatGPT and GPT-4 Good Poker Players? — A Pre-Flop Analysis
要約 ChatGPT と GPT-4 の導入以来、これらのモデルは多数のタスクに … 続きを読む
Finding Nash equilibria by minimizing approximate exploitability with learned best responses
要約 ゲーム理論の均衡を見つけることに関しては、かなりの進歩が見られました。 そ … 続きを読む
Nonparametric Strategy Test
要約 我々は、エージェントのプレイのサンプルが与えられた場合に、エージェントが反 … 続きを読む
Sequential Principal-Agent Problems with Communication: Efficient Computation and Learning
要約 私たちは、双方の不完全な情報を持つプリンシパルとエージェントの間の逐次的意 … 続きを読む