要約
タイトル:Deep Reinforcement Learning, a textbook
要約:
– 最近、深層強化学習は注目を集めている。
– 自律走行、ゲームプレイ、分子再結合、ロボティクスなど、多種多様な活動において、驚くべき結果が得られた。
– すべての分野において、コンピュータプログラムは、困難な問題を自分で解決することを学んだ。
– モデルヘリコプターを飛ばし、ループやロールなどの空中曲技を行うことを学んだ。
– いくつかのアプリケーションでは、Atari、Go、ポーカー、StarCraftなど、最高レベルの人間よりも優れている。
– 深層強化学習が複雑な環境を探索する方法は、子供が物事を遊びを通じて試して、フィードバックを受けて、再試行することを思い出させる。
– コンピュータは、真に人間の学習の側面を持つように思われる。
– この本の目的は、深層強化学習の分野について包括的な概要を提供することである。
– 本書は、人工知能の大学院生、研究者、実践者が、深層強化学習手法とその課題をより良く理解するために書かれている。
– コンピュータサイエンスと人工知能の学部レベルの理解を前提としており、プログラム言語はPythonである。
– この分野の基礎、アルゴリズム、応用について説明している。
– この分野の基礎を形成するモデルフリーおよびモデルベースの手法をカバーしている。
– 進展は速いが、深層マルチエージェント強化学習、深層階層型強化学習、深層メタ学習などの高度なトピックにも触れている。
要約(オリジナル)
Deep reinforcement learning has gathered much attention recently. Impressive results were achieved in activities as diverse as autonomous driving, game playing, molecular recombination, and robotics. In all these fields, computer programs have taught themselves to solve difficult problems. They have learned to fly model helicopters and perform aerobatic manoeuvers such as loops and rolls. In some applications they have even become better than the best humans, such as in Atari, Go, poker and StarCraft. The way in which deep reinforcement learning explores complex environments reminds us of how children learn, by playfully trying out things, getting feedback, and trying again. The computer seems to truly possess aspects of human learning; this goes to the heart of the dream of artificial intelligence. The successes in research have not gone unnoticed by educators, and universities have started to offer courses on the subject. The aim of this book is to provide a comprehensive overview of the field of deep reinforcement learning. The book is written for graduate students of artificial intelligence, and for researchers and practitioners who wish to better understand deep reinforcement learning methods and their challenges. We assume an undergraduate-level of understanding of computer science and artificial intelligence; the programming language of this book is Python. We describe the foundations, the algorithms and the applications of deep reinforcement learning. We cover the established model-free and model-based methods that form the basis of the field. Developments go quickly, and we also cover advanced topics: deep multi-agent reinforcement learning, deep hierarchical reinforcement learning, and deep meta learning.
arxiv情報
著者 | Aske Plaat |
発行日 | 2023-04-23 08:53:57+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, OpenAI