-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.GT」カテゴリーアーカイブ
Maximize to Explore: One Objective Function Fusing Estimation, Planning, and Exploration
要約 オンライン強化学習 (オンライン RL) では、サンプル効率の高い方法で最 … 続きを読む
Guarantees for Self-Play in Multiplayer Games via Polymatrix Decomposability
要約 セルフプレイは、学習アルゴリズムがそれ自体のコピーと対話することによって学 … 続きを読む
Rule Enforcing Through Ordering
要約 大都市での軽微な交通違反など、現実世界の多くの状況では、中央当局は多数の個 … 続きを読む
RealFM: A Realistic Mechanism to Incentivize Data Contribution and Device Participation
要約 フェデレーティング ラーニング (FL) へのエッジ デバイスの参加は、通 … 続きを読む
On the Convergence of No-Regret Learning Dynamics in Time-Varying Games
要約 ゲームでの学習に関する文献のほとんどは、根底にある繰り返されるゲームが時間 … 続きを読む
Markov $α$-Potential Games: Equilibrium Approximation and Regret Analysis
要約 この論文は、マルコフ ゲームにおけるマルチエージェント相互作用を研究するた … 続きを読む
On a Connection between Differential Games, Optimal Control, and Energy-based Models for Multi-Agent Interactions
要約 ゲーム理論は、マルチエージェント相互作用をモデル化するための解釈可能な数学 … 続きを読む
The Consensus Game: Language Model Generation via Equilibrium Search
要約 質問応答やその他のテキスト生成タスクに適用される場合、言語モデル (LM) … 続きを読む
Nash Welfare and Facility Location
要約 路線沿いにある一連のエージェントにサービスを提供する施設を見つける問題を考 … 続きを読む
Strategic Evaluation: Subjects, Evaluators, and Society
要約 現在のアルゴリズムの広範な応用は、意思決定を行うための、曖昧な概念 (メリ … 続きを読む