要約
強化学習 (RL) の効率とパフォーマンスを向上させるために、動物のビデオの使用を調査します。
理論的な観点から、ポリシー外の RL に加重ポリシー最適化を使用する動機を与え、ビデオから学習する際の主な課題を説明し、解決策を提案します。
オフラインとオンラインの RL でアイデアをテストし、一連の 2D ナビゲーション タスクで有望な結果を示します。
要約(オリジナル)
We investigate the use of animals videos to improve efficiency and performance in Reinforcement Learning (RL). Under a theoretical perspective, we motivate the use of weighted policy optimization for off-policy RL, describe the main challenges when learning from videos and propose solutions. We test our ideas in offline and online RL and show encouraging results on a series of 2D navigation tasks.
arxiv情報
著者 | Vittorio Giammarino |
発行日 | 2022-09-27 14:47:06+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google