60J10」カテゴリーアーカイブ

Leveraging Factored Action Spaces for Off-Policy Evaluation

要約 オフポリシー評価 (OPE) は、実行されたシーケンスから収集されたデータ … 続きを読む

カテゴリー: 60J10, 62D05, 62D20, 62P10, cs.AI, cs.LG, G.3, stat.ML | Leveraging Factored Action Spaces for Off-Policy Evaluation はコメントを受け付けていません