93E20」カテゴリーアーカイブ

A Fisher-Rao gradient flow for entropy-regularised Markov decision processes in Polish spaces

要約 我々は、ポーランドの状態および行動空間を用いた無限地平線エントロピー正則化 … 続きを読む

カテゴリー: 60B05, 90C26, 90C40, 90C53, 93E20, cs.LG, math.OC, math.PR | A Fisher-Rao gradient flow for entropy-regularised Markov decision processes in Polish spaces はコメントを受け付けていません

Soft-constrained Schrodinger Bridge: a Stochastic Control Approach

要約 シュディンガー ブリッジは、終端分布が事前に指定された目標分布と一致する、 … 続きを読む

カテゴリー: 60J60, 60J70, 93E20, cs.LG, math.OC, stat.CO, stat.ML | Soft-constrained Schrodinger Bridge: a Stochastic Control Approach はコメントを受け付けていません

A Fisher-Rao gradient flow for entropy-regularised Markov decision processes in Polish spaces

要約 我々は、ポーランドの状態と行動空間を用いた無限地平線エントロピー正則化マル … 続きを読む

カテゴリー: 60B05, 90C26, 90C40, 90C53, 93E20, cs.LG, math.OC, math.PR | A Fisher-Rao gradient flow for entropy-regularised Markov decision processes in Polish spaces はコメントを受け付けていません

Stability of Q-Learning Through Design and Optimism

要約 Q ラーニングは、1980 年代に Chris Watkins の論文で導 … 続きを読む

カテゴリー: 62L20, 68T05, 93E20, 93E35, cs.LG, cs.SY, eess.SY, math.OC | Stability of Q-Learning Through Design and Optimism はコメントを受け付けていません

Geometric constraints improve inference of sparsely observed stochastic dynamics

要約 タイトル:幾何学的制約は希薄に観測された確率的な動力学の推論を改善する 要 … 続きを読む

カテゴリー: 35B42, 37H05, 37M21, 82C99, 93E10, 93E12, 93E20, cond-mat.stat-mech, cs.LG, G.3, math.DS, physics.data-an, stat.ME | Geometric constraints improve inference of sparsely observed stochastic dynamics はコメントを受け付けていません