「93E20」カテゴリーアーカイブ

A Fisher-Rao gradient flow for entropy-regularised Markov decision processes in Polish spaces

投稿日: 2024年12月6日作成者: jarxiv

要約我々は、ポーランドの状態および行動空間を用いた無限地平線エントロピー正則化 … 続きを読む →

カテゴリー: 60B05, 90C26, 90C40, 90C53, 93E20, cs.LG, math.OC, math.PR | コメントを受け付けていません

投稿日: 2024年4月23日作成者: jarxiv

要約シュディンガーブリッジは、終端分布が事前に指定された目標分布と一致する、 … 続きを読む →

カテゴリー: 60J60, 60J70, 93E20, cs.LG, math.OC, stat.CO, stat.ML | コメントを受け付けていません

投稿日: 2023年10月5日作成者: jarxiv

要約我々は、ポーランドの状態と行動空間を用いた無限地平線エントロピー正則化マル … 続きを読む →

カテゴリー: 60B05, 90C26, 90C40, 90C53, 93E20, cs.LG, math.OC, math.PR | コメントを受け付けていません

投稿日: 2023年8月22日作成者: jarxiv

要約 Q ラーニングは、1980 年代に Chris Watkins の論文で導 … 続きを読む →

カテゴリー: 62L20, 68T05, 93E20, 93E35, cs.LG, cs.SY, eess.SY, math.OC | コメントを受け付けていません

投稿日: 2023年4月5日作成者: jarxiv

要約タイトル：幾何学的制約は希薄に観測された確率的な動力学の推論を改善する要 … 続きを読む →

カテゴリー: 35B42, 37H05, 37M21, 82C99, 93E10, 93E12, 93E20, cond-mat.stat-mech, cs.LG, G.3, math.DS, physics.data-an, stat.ME | コメントを受け付けていません