-
最近の投稿
- Solving Multi-Agent Safe Optimal Control with Distributed Epigraph Form MARL
- Nearly Optimal Nonlinear Safe Control with BaS-SDRE
- Field Report on Ground Penetrating Radar for Localization at the Mars Desert Research Station
- LAPP: Large Language Model Feedback for Preference-Driven Reinforcement Learning
- CityWalker: Learning Embodied Urban Navigation from Web-Scale Videos
-
最近のコメント
表示できるコメントはありません。 cs.AI (36968) cs.CL (27986) cs.CV (42734) cs.HC (2830) cs.LG (41908) cs.RO (21895) cs.SY (3335) eess.IV (4980) eess.SY (3327) stat.ML (5485)
「cs.GT」カテゴリーアーカイブ
Results about sets of desirable gamble sets
要約 望ましいギャンブル セットの一貫したセットは、不確実性の下でエージェントの … 続きを読む
Incentive-compatible Bandits: Importance Weighting No More
要約 私たちは、バンディットフィードバックを使用して、インセンティブと互換性のあ … 続きを読む
Selecting the Most Conflicting Pair of Candidates
要約 私たちは、有権者の好みに応じて、最も対立する候補者、つまり最も多くの対立を … 続きを読む
Truthful Aggregation of LLMs with an Application to Online Advertising
要約 私たちは、エージェントが自分の好みを変更したり誇張したりする可能性がある、 … 続きを読む
Imprecise Probabilities Meet Partial Observability: Game Semantics for Robust POMDPs
要約 部分観察可能なマルコフ決定プロセス (POMDP) は、確率分布が正確にわ … 続きを読む
Scalable Mechanism Design for Multi-Agent Path Finding
要約 マルチエージェント経路探索 (MAPF) には、複数のエージェントが共有エ … 続きを読む
Value Approximation for Two-Player General-Sum Differential Games with State Constraints
要約 ハミルトン・ヤコビ・アイザックス (HJI) 偏微分方程式を解くと、2 プ … 続きを読む
Zero-Sum Positional Differential Games as a Framework for Robust Reinforcement Learning: Deep Q-Learning Approach
要約 ロバスト強化学習(RRL)は、不確実性や擾乱に対してロバストなモデルを学習 … 続きを読む
ZeroSwap: Data-driven Optimal Market Making in DeFi
要約 自動マーケットメーカー (AMM) は、分散型金融における流動性の供給と需 … 続きを読む
Emergent specialization from participation dynamics and multi-learner retraining
要約 多くのオンライン サービスはデータ駆動型です。ユーザーの行動はシステムのパ … 続きを読む