93E03」カテゴリーアーカイブ

On the continuity and smoothness of the value function in reinforcement learning and optimal control

要約 価値関数は、強化学習と最適制御の両方においてエージェントが受け取る将来の累 … 続きを読む

カテゴリー: 37H99, 37N35, 93E03, cs.AI, cs.SY, eess.SY, I.2.8 | On the continuity and smoothness of the value function in reinforcement learning and optimal control はコメントを受け付けていません