-
最近の投稿
- Knowledge Graph Completion with Mixed Geometry Tensor Factorization
- Iterated $Q$-Network: Beyond One-Step Bellman Updates in Deep Reinforcement Learning
- Multi-SWE-bench: A Multilingual Benchmark for Issue Resolving
- Improving Counterfactual Truthfulness for Molecular Property Prediction through Uncertainty Quantification
- Learning Geometrically-Informed Lyapunov Functions with Deep Diffeomorphic RBF Networks
-
最近のコメント
表示できるコメントはありません。 cs.AI (36097) cs.CL (27286) cs.CR (2747) cs.CV (41948) cs.LG (41052) cs.RO (21304) cs.SY (3219) eess.IV (4920) eess.SY (3213) stat.ML (5378)
「93E20」カテゴリーアーカイブ
A Fisher-Rao gradient flow for entropy-regularised Markov decision processes in Polish spaces
要約 我々は、ポーランドの状態および行動空間を用いた無限地平線エントロピー正則化 … 続きを読む
Soft-constrained Schrodinger Bridge: a Stochastic Control Approach
要約 シュディンガー ブリッジは、終端分布が事前に指定された目標分布と一致する、 … 続きを読む
A Fisher-Rao gradient flow for entropy-regularised Markov decision processes in Polish spaces
要約 我々は、ポーランドの状態と行動空間を用いた無限地平線エントロピー正則化マル … 続きを読む
Stability of Q-Learning Through Design and Optimism
要約 Q ラーニングは、1980 年代に Chris Watkins の論文で導 … 続きを読む
Geometric constraints improve inference of sparsely observed stochastic dynamics
要約 タイトル:幾何学的制約は希薄に観測された確率的な動力学の推論を改善する 要 … 続きを読む