90C05」カテゴリーアーカイブ

Strongly-polynomial time and validation analysis of policy gradient methods

要約 この論文では、有限状態およびアクションのマルコフ決定プロセス (MDP) … 続きを読む

カテゴリー: 49K45, 49M05, 90C05, 90C26, 90C40, 90C46, cs.AI, cs.DS, cs.LG, math.OC | Strongly-polynomial time and validation analysis of policy gradient methods はコメントを受け付けていません