93C42」カテゴリーアーカイブ

Fuzzy Logic Guided Reward Function Variation: An Oracle for Testing Reinforcement Learning Programs

要約 強化学習 (RL) は、さまざまな分野で大きな注目を集めています。 ただし … 続きを読む

カテゴリー: 68T05, 68T27, 93C42, cs.AI, cs.SE, D.2.5 | コメントする