-
最近の投稿
- A Systematic Approach to Design Real-World Human-in-the-Loop Deep Reinforcement Learning: Salient Features, Challenges and Trade-offs
- Robo-Troj: Attacking LLM-based Task Planners
- SE(3)-Equivariant Robot Learning and Control: A Tutorial Survey
- Geometric Formulation of Unified Force-Impedance Control on SE(3) for Robotic Manipulators
- Subframework-based Bearing Rigidity Maintenance Control in Multirobot Networks
-
最近のコメント
表示できるコメントはありません。 cs.AI (37106) cs.CL (28087) cs.CV (42847) cs.HC (2837) cs.LG (42044) cs.RO (21987) cs.SY (3355) eess.IV (4990) eess.SY (3347) stat.ML (5498)
「93E20」カテゴリーアーカイブ
A Fisher-Rao gradient flow for entropy-regularised Markov decision processes in Polish spaces
要約 我々は、ポーランドの状態および行動空間を用いた無限地平線エントロピー正則化 … 続きを読む
Soft-constrained Schrodinger Bridge: a Stochastic Control Approach
要約 シュディンガー ブリッジは、終端分布が事前に指定された目標分布と一致する、 … 続きを読む
A Fisher-Rao gradient flow for entropy-regularised Markov decision processes in Polish spaces
要約 我々は、ポーランドの状態と行動空間を用いた無限地平線エントロピー正則化マル … 続きを読む
Stability of Q-Learning Through Design and Optimism
要約 Q ラーニングは、1980 年代に Chris Watkins の論文で導 … 続きを読む
Geometric constraints improve inference of sparsely observed stochastic dynamics
要約 タイトル:幾何学的制約は希薄に観測された確率的な動力学の推論を改善する 要 … 続きを読む