-
最近の投稿
- Video Prediction Policy: A Generalist Robot Policy with Predictive Visual Representations
- Recursive Decomposition with Dependencies for Generic Divide-and-Conquer Reasoning
- Invoke Interfaces Only When Needed: Adaptive Invocation for Large Language Models in Question Answering
- A Synergistic Framework of Nonlinear Acoustic Computing and Reinforcement Learning for Real-World Human-Robot Interaction
- RoboPanoptes: The All-seeing Robot with Whole-body Dexterity
-
最近のコメント
表示できるコメントはありません。 cs.AI (37618) cs.CL (28441) cs.CV (43250) cs.HC (2877) cs.LG (42544) cs.RO (22329) cs.SY (3427) eess.IV (5024) eess.SY (3419) stat.ML (5549)
「cs.GT」カテゴリーアーカイブ
Unsynchronized Decentralized Q-Learning: Two Timescale Analysis By Persistence
要約 非定常性は、マルチエージェント強化学習(MARL)の基本的な課題であり、エ … 続きを読む
Differentially Private Equilibrium Finding in Polymatrix Games
要約 Polymatrixゲームでは、プライバシー制約の差で平衡発見を研究してい … 続きを読む
Fair Play in the Fast Lane: Integrating Sportsmanship into Autonomous Racing Systems
要約 自律的なレースは、高速の意思決定とモーションコントロールのプラットフォーム … 続きを読む
Incentive-Compatible Recovery from Manipulated Signals, with Applications to Decentralized Physical Infrastructure
要約 他のプレイヤー(「オブザーバー」)によって導出された暗黙の信号を使用して、 … 続きを読む
Learning Nash Equilibrial Hamiltonian for Two-Player Collision-Avoiding Interactions
要約 2プレイヤーのリスクに敏感な衝突を回避する相互作用のためのナッシュ平衡ポリ … 続きを読む
Incentivizing Truthful Collaboration in Heterogeneous Federated Learning
要約 Federated Learning(FL)は、RAWデータの代わりに勾配 … 続きを読む
Optimally Installing Strict Equilibria
要約 この作業では、標準的なソリューションの概念全体にわたる厳格な平衡として望ま … 続きを読む
On Separation Between Best-Iterate, Random-Iterate, and Last-Iterate Convergence of Learning in Games
要約 ゲームにおける学習ダイナミクスの非エルゴディック収束は、理論と実践の両方に … 続きを読む
Last-Iterate Convergence Properties of Regret-Matching Algorithms in Games
要約 後悔の$^+$(rm $^+$)に基づいて、2プレイヤーゼロサムゲームを解 … 続きを読む