-
最近の投稿
- Solving Multi-Agent Safe Optimal Control with Distributed Epigraph Form MARL
- Nearly Optimal Nonlinear Safe Control with BaS-SDRE
- Field Report on Ground Penetrating Radar for Localization at the Mars Desert Research Station
- LAPP: Large Language Model Feedback for Preference-Driven Reinforcement Learning
- CityWalker: Learning Embodied Urban Navigation from Web-Scale Videos
-
最近のコメント
表示できるコメントはありません。 cs.AI (36968) cs.CL (27986) cs.CV (42734) cs.HC (2830) cs.LG (41908) cs.RO (21895) cs.SY (3335) eess.IV (4980) eess.SY (3327) stat.ML (5485)
「37H99」カテゴリーアーカイブ
On the continuity and smoothness of the value function in reinforcement learning and optimal control
要約 価値関数は、強化学習と最適制御の両方においてエージェントが受け取る将来の累 … 続きを読む
Beyond expectations: Residual Dynamic Mode Decomposition and Variance for Stochastic Dynamical Systems
要約 コープマン演算子は非線形力学システムを線形化し、そのスペクトル情報を非常に … 続きを読む
Beyond expectations: Residual Dynamic Mode Decomposition and Variance for Stochastic Dynamical Systems
要約 コープマン演算子は非線形力学システムを線形化し、そのスペクトル情報を非常に … 続きを読む