-
最近の投稿
- Solving Multi-Agent Safe Optimal Control with Distributed Epigraph Form MARL
- Nearly Optimal Nonlinear Safe Control with BaS-SDRE
- Field Report on Ground Penetrating Radar for Localization at the Mars Desert Research Station
- LAPP: Large Language Model Feedback for Preference-Driven Reinforcement Learning
- CityWalker: Learning Embodied Urban Navigation from Web-Scale Videos
-
最近のコメント
表示できるコメントはありません。 cs.AI (36968) cs.CL (27986) cs.CV (42734) cs.HC (2830) cs.LG (41908) cs.RO (21895) cs.SY (3335) eess.IV (4980) eess.SY (3327) stat.ML (5485)
「cs.GT」カテゴリーアーカイブ
GemNet: Menu-Based, Strategy-Proof Multi-Bidder Auctions Through Deep Learning
要約 微分可能経済学では、深層学習を使用して自動メカニズム設計を行います。 大き … 続きを読む
Automating Food Drop: The Power of Two Choices for Dynamic and Fair Food Allocation
要約 食料廃棄と食料不安は、密接に関連する 2 つの差し迫った世界的問題です。 … 続きを読む
From Stream to Pool: Pricing Under the Law of Diminishing Marginal Utility
要約 動的価格設定モデルでは、多くの場合、$\textbf{stream}$ の … 続きを読む
Robust Reward Design for Markov Decision Processes
要約 報酬設計の問題では、リーダーとフォロワーの間の相互作用を調べます。リーダー … 続きを読む
Quantifying Misalignment Between Agents
要約 近年、AI アライメント問題に対する懸念が高まっており、これまでの研究では … 続きを読む
Solution Concepts in Hierarchical Games under Bounded Rationality with Applications to Autonomous Driving
要約 自動運転車 (AV) が通常の人間の交通にさらに統合されるようになるにつれ … 続きを読む
Minimally Modifying a Markov Game to Achieve Any Nash Equilibrium and Value
要約 私たちは、善意のゲーム設計者または悪意のある敵対者が、ターゲットの決定論的 … 続きを読む
State-Constrained Zero-Sum Differential Games with One-Sided Information
要約 私たちは、状態制約と一方的な情報を備えたゼロサム差分ゲームを研究します。こ … 続きを読む
Social Choice Should Guide AI Alignment in Dealing with Diverse Human Feedback
要約 GPT-4 などの財団モデルは、犯罪の幇助や人種差別的なテキストの作成など … 続きを読む