-
最近の投稿
- Learning Multimodal Latent Dynamics for Human-Robot Interaction
- Poutine: Vision-Language-Trajectory Pre-Training and Reinforcement Learning Post-Training Enable Robust End-to-End Autonomous Driving
- Gondola: Grounded Vision Language Planning for Generalizable Robotic Manipulation
- Demonstration Sidetracks: Categorizing Systematic Non-Optimality in Human Demonstrations
- Sensor Model Identification via Simultaneous Model Selection and State Variable Determination
-
最近のコメント
表示できるコメントはありません。 cs.AI (39679) cs.CL (30032) cs.CV (45003) cs.HC (3029) cs.LG (44613) cs.RO (23728) cs.SY (3617) eess.IV (5159) eess.SY (3609) stat.ML (5797)
「cs.GT」カテゴリーアーカイブ
Combining Deep Reinforcement Learning and Search with Generative Models for Game-Theoretic Opponent Modeling
要約 対戦相手のモデリング方法には、通常、2つの重要な手順が含まれます。対戦相手 … 続きを読む
Adaptive Discretization against an Adversary: Lipschitz bandits, Dynamic Pricing, and Auction Tuning
要約 Lipschitz Banditsは、$ [0,1] $間隔などの大きく構 … 続きを読む
Diffusion of Responsibility in Collective Decision Making
要約 「責任の拡散」という用語は、複数のエージェントが結果に対する責任を共有し、 … 続きを読む
Beyond Winning Strategies: Admissible and Admissible Winning Strategies for Quantitative Reachability Games
要約 古典的な反応性合成アプローチは、特定の仕様を常に満たすリアクティブシステム … 続きを読む
Microgrids Coalitions for Energy Market Balancing
要約 電力流通ネットワークに再生可能なソースが統合されると、エネルギー市場のバラ … 続きを読む
Conservative classifiers do consistently well with improving agents: characterizing statistical and online learning
要約 機械学習は、たとえば、求職者やローン申請の評価において、社会的意思決定にお … 続きを読む
PAC Learning with Improvements
要約 機械学習における最も基本的な下界の一つは、ほぼ全ての非自明な設定において、 … 続きを読む
Designing Algorithmic Delegates: The Role of Indistinguishability in Human-AI Handoff
要約 AI技術の進歩に伴い、人々はAIエージェントに仕事を任せることを望むように … 続きを読む
Distortion of AI Alignment: Does Preference Optimization Optimize for Preferences?
要約 トレーニング前の後、大規模な言語モデルは、ペアワイズ比較に基づいて人間の好 … 続きを読む
Learned Collusion
要約 Qラーニングは、利用可能な各アクションに関連付けられた継続値の推定値(Q値 … 続きを読む